無(wú)人機(jī)線路板:線路板廠在CES迎來(lái)Yuneec的黑級(jí)雙目自動(dòng)避障技術(shù)之后,這回我們?cè)诖蠼甈hantom 4的發(fā)布會(huì)里,再次迎來(lái)第二顆黑級(jí)沖擊:基于雙目避障的視覺(jué)追蹤技術(shù)。然而,為什么大疆的Phantom 4和Yuneec的Typhoon H,可以像有生命的一樣自動(dòng)回避障礙物?
原因是:它們都有一雙眼睛。
什么是“雙目”?
視覺(jué)是一種基于2D的感知,我們?cè)?D畫面下只能知道長(zhǎng)度和闊度,但是不能感知深度和距離,但生物能判別深度和距離,是因?yàn)槲覀儾粏沃挥幸恢谎劬?,而是?ldquo;一雙”眼睛。我們可以透過(guò)眼睛的左右距離,與觀察的對(duì)像產(chǎn)生視差(Parallax),藉此獲得深度和距離的信息。
大家不妨試試:把手指放在眼前,分別采用單眼及雙眼方式盯著,然后把手指往前/后移動(dòng)。如果你單著眼看,你只能透過(guò)手指的大小和焦距來(lái)判定它的大約位置;但當(dāng)你使用雙眼盯著,才能準(zhǔn)確地估算你的手指離你多遠(yuǎn)。從此可見,對(duì)于人類來(lái)說(shuō),“一雙眼睛”是我們由2D世界進(jìn)化至3D世界的關(guān)鍵,我們會(huì)稱這種效果為“立體視覺(jué)”以及“雙目視覺(jué)”。
同樣地,對(duì)于科技界別來(lái)說(shuō)也是一樣:在天文學(xué)或測(cè)量學(xué)上的三角測(cè)量術(shù)(上圖),其方法很類似生物使用雙目測(cè)距。同樣地,下圖是大疆無(wú)人機(jī)的設(shè)計(jì),在起降架的上方各有一只眼睛,無(wú)人機(jī)就能透過(guò)這一雙眼睛,利用三角測(cè)量法來(lái)判定對(duì)像的遠(yuǎn)近。
何以要用雙目?
無(wú)人機(jī)發(fā)展多年,早就能透過(guò)GPS判定無(wú)人機(jī)在平面上的位置(2D),藉此進(jìn)行定點(diǎn)懸停。但是,如何讓無(wú)人機(jī)感知距離,回避障礙,一直都是個(gè)很大的難題。
我們最早的測(cè)距方式其實(shí)有點(diǎn)像車?yán)走_(dá),透過(guò)類似蝙蝠的“聽覺(jué)”,向測(cè)距對(duì)像射出電波,感知反射后判定物件的方向和位置。法國(guó)無(wú)人機(jī)公司Parrot旗下的AR.Drone 無(wú)人機(jī),最早就透過(guò)超聲波方式往下方測(cè)距,讓無(wú)人機(jī)能固定在同一高度上飛行;而零度無(wú)人機(jī)的探索者第二代則采用特殊紅外線方式360度測(cè)距(下圖),藉此回避障礙物。然而,雷達(dá)式測(cè)距的最大限制是:它需要先發(fā)射電波,然后偵察電波反射;在續(xù)航力和電波發(fā)射功率的限制下,很難進(jìn)行長(zhǎng)距離的測(cè)距:例如Parrot Bebop Drone的超聲波定高,最高距離只有8米,而零度探索者2的最大回避半徑,則只有6米。
但透過(guò)雙目感應(yīng)器,只要在光線良好的環(huán)境下,它的自動(dòng)避障距離比雷達(dá)式避障要遠(yuǎn)得多:大疆的雙目感應(yīng)器可以判斷最遠(yuǎn)約15米的障礙,比Parrot Bebop Drone遠(yuǎn)了接近一倍。
智能的眼睛
由于雙目感應(yīng)器有更廣闊的距離判定能力,讓它能提供更智能的飛行方式。
大疆Phantom 4或是Yuneec Typhoon H這種采用雙目感應(yīng)器的無(wú)人機(jī),能在飛行時(shí)同時(shí)取得長(zhǎng)、闊、深的數(shù)據(jù),瞬間進(jìn)行基本的3D建模,從而讓無(wú)人機(jī)回避的同時(shí),即時(shí)重新規(guī)劃最優(yōu)的飛行路線,繞過(guò)障礙(下圖);而不是像超聲波避障一樣只能直接停下來(lái)。除此之外,由于無(wú)人機(jī)的整個(gè)飛行路線都能基于視覺(jué)來(lái)調(diào)整——用人話來(lái)說(shuō),就是你可以直接用畫面來(lái)控制你的飛行路線,故此,我們現(xiàn)在可以直接以最最最直觀的圖像方式來(lái)控?zé)o人機(jī):大疆的Phantom 4里的“視覺(jué)追蹤”和“指點(diǎn)飛行”,就是透過(guò)雙目感應(yīng)器來(lái)增強(qiáng)可靠性。雖然說(shuō)目前有部份無(wú)人機(jī)也實(shí)現(xiàn)了視覺(jué)操控和追蹤的能力,但操控的準(zhǔn)確度與敏捷度,并不能與擁有雙目感應(yīng)器的無(wú)人機(jī)相比。
誠(chéng)然,雙目避障雖然是黑級(jí)科技,但算不上是什么新玩意,大疆其實(shí)只是沿用了他們?cè)械腉uidance技術(shù)。大家一直不能在消費(fèi)級(jí)無(wú)人機(jī)上使用雙目避障,其主因是雙目避障也是把雙刃劍,它有其優(yōu)勢(shì),但同時(shí)亦有其限制。
雙目的限制
雙目避障的最大問(wèn)題是:它需要進(jìn)行大量的圖像分析,而圖像分析往往需要大量的計(jì)算機(jī)資源來(lái)運(yùn)算,所以它對(duì)于無(wú)人機(jī)的大腦-“飛行控制器”的運(yùn)算速度有不低的要求,這也是高通和英特爾這兩家處理器巨頭,為甚么能藉著強(qiáng)大的運(yùn)算能力而跨界插足無(wú)人機(jī)范疇。而且,亦由于雙目避障需要大量的運(yùn)算,導(dǎo)致增加了耗電量,這也是大疆本來(lái)就掌握了是360度雙目避障技術(shù),但最后Phantom 4卻只采用前向避障的最大原因。
雙目避障除了是對(duì)處理器和續(xù)航力有要求之外,它也直接沖擊了無(wú)人機(jī)的生產(chǎn)成本。在電腦或手機(jī)界別,英特爾和高通的高速芯片售價(jià)不菲,而且雙目感應(yīng)器和它的一堆配套也需要額外購(gòu)買,成本難免上升。
在目前無(wú)人機(jī)陷于價(jià)格戰(zhàn)的環(huán)境下,雙目避障未必就是個(gè)最佳的選擇。
無(wú)人機(jī)的新視覺(jué)
無(wú)論雙目避障的限制有多大,它已經(jīng)成為目前無(wú)人機(jī)界別的最主要的創(chuàng)新空間。而且,我先前經(jīng)常強(qiáng)調(diào):無(wú)人機(jī)的門檻很低,要造無(wú)人機(jī)并不困難;但是,雙目避障在技術(shù)上、在成本上,也很可能成為無(wú)人機(jī)巨頭與后來(lái)者之間的一個(gè)巨大門檻。
好吧,來(lái)到這個(gè)地步,無(wú)人機(jī)線路板廠真的可以告訴你說(shuō)無(wú)人機(jī)是“高級(jí)遙控飛機(jī)”了。