Robotaxi,防火防盜防“建筑工地”。Waymo 就栽了。
北美監(jiān)管部門剛剛又開(kāi)啟了針對(duì) Waymo 無(wú)人車的調(diào)查,起因是收到一系列相關(guān)事故報(bào)告。
有撞上路邊停放車輛的,有撞靜止障礙物的,阻塞交通的… 以及一個(gè)不尋常高頻場(chǎng)景:建筑工地。
發(fā)生了什么
大概 3 個(gè)月內(nèi),Waymo 積累上報(bào)了 22 起事故,引起了美國(guó)國(guó)家公路交通安全管理局的注意。
根據(jù) NHTSA 的文件顯示,這些事故包括 Waymo 無(wú)人車和靜止和半靜止物體(比如門)相撞、與停放車輛相撞以及違反交通安全控制裝置的情況。
其中“違反交通安全控制裝置”官方特別說(shuō)明是一個(gè)重點(diǎn)調(diào)查方向,一個(gè)典型場(chǎng)景就是自動(dòng)駕駛系統(tǒng)對(duì)交通錐 / 雪糕筒的檢測(cè)識(shí)別能力。
這個(gè)點(diǎn)比較罕見(jiàn)。因?yàn)檫@次上報(bào)的 22 起事故中,很多都涉及同一種場(chǎng)景 —— 建筑工地。
比如上個(gè)月,6 輛編隊(duì)行駛的 Waymo Robotaxi,下班收工回停車場(chǎng),結(jié)果遇到了施工現(xiàn)場(chǎng)臨時(shí)交通管制,直接卡死在雪糕筒圍成的臨時(shí)通行區(qū),造成了大約半個(gè)小時(shí)交通擁堵。
有本地生活經(jīng)驗(yàn)的網(wǎng)友立刻就認(rèn)出來(lái),這是舊金山 Potrero 大道 101 號(hào)匝道,Waymo 無(wú)人車卡死的地方,剛好是高速入口。
最后,是路上的司機(jī)老哥直接下車手動(dòng)挪開(kāi)雪糕筒,后面的車隊(duì)依次繞過(guò)幾輛“癱瘓”的無(wú)人車。
Waymo 方面出了一個(gè)簡(jiǎn)單聲明,大意是 30 分鐘內(nèi)就派人去現(xiàn)場(chǎng)挪車了,沒(méi)有造成任何傷亡和財(cái)產(chǎn)損失,后續(xù)會(huì)配合調(diào)查。
不過(guò)在鳳凰城的建筑工地,就沒(méi)這么幸運(yùn)了。
同樣一輛 Waymo 無(wú)人車,無(wú)視了雪糕筒圍出的施工區(qū)域,直接沖進(jìn)了建筑工地。
幸好速度不快沒(méi)撞到人,不過(guò)車輛本身、工地現(xiàn)場(chǎng)都有不同程度損失。
類似這樣的事故很多,每次無(wú)人車“沖進(jìn)工地”的小視頻,都會(huì)在網(wǎng)絡(luò)上瘋傳。
網(wǎng)友總結(jié)的很生動(dòng):交通錐就是 Robotaxi 的氪石(kryptonite),現(xiàn)在再神通廣大的自動(dòng)駕駛,遇到封閉道路的交通錐,都得完蛋。
咦?好像跟 Waymo 官方秀出的視頻不太一樣呀。
為什么建筑工地難?
Waymo 第五代自動(dòng)駕駛系統(tǒng)繞行施工區(qū),曾被當(dāng)做技術(shù)亮點(diǎn)專門解析過(guò)。
官方的 Demo 中,無(wú)人車面對(duì)的場(chǎng)景更加復(fù)雜,除了交通錐、不規(guī)則區(qū)域,還有來(lái)回走動(dòng)的工人。
Waymo 無(wú)人車當(dāng)然是毫不費(fèi)力完成了一系列避讓、繞行動(dòng)作,順利通過(guò)了施工區(qū)域:
這里面讓人嘖嘖稱奇的是,Waymo 無(wú)人車似乎能夠看懂人類指揮交通的肢體語(yǔ)言,讓停就停,讓走就走,而不僅僅以路面條件作為依據(jù)。
怎么做到的?Waymo 負(fù)責(zé)預(yù)測(cè)算法的工程師 Maya Kabkab 簡(jiǎn)要解釋了一下,大意是第五代技術(shù)中,Waymo 加強(qiáng)了對(duì)不同物體目標(biāo)的理解能力,以及對(duì)可通行區(qū)域的識(shí)別能力,這兩項(xiàng)使得系統(tǒng)能更好規(guī)劃通行路線。
核心是用全新模型 VectorNet 替代 CNN,提取傳感器和高精地圖信息。
簡(jiǎn)單的說(shuō),是將高精地圖和傳感器輸入信息表示為點(diǎn)、多邊形或曲線,VectorNet 則將所有道路特征和其他對(duì)象的軌跡表示為相應(yīng)的向量?;谶@個(gè)簡(jiǎn)化的視圖,VectorNet 可以提取每個(gè)向量的信息以及學(xué)習(xí)不同向量之間的關(guān)系。
好處是 VectorNet 比 CNN 占用計(jì)算資源更少,出結(jié)果的速度更快,理論上也能更加清晰的提取出關(guān)鍵場(chǎng)景信息。
但 VectorNet 仍然沒(méi)有解決“建筑工地”難題的核心 ——
“建筑工地”本身是高精地圖的例外,不可能同步更新,只能靠傳感器實(shí)時(shí)感知。
但傳感器的數(shù)據(jù)在不同子模型之間依次傳遞,信息損失難以完全避免。
Robotaxi 頻繁出現(xiàn)被建筑工地卡死,直接原因是對(duì)交通錐、異形物的錯(cuò)檢漏檢。
而深層原因,是傳統(tǒng)自動(dòng)駕駛技術(shù)范式存在能力的上限、天花板,難以覆蓋路上所有的 corner case。
所以能不能順利避讓建筑工地,成了一種概率事件:官方 Demo 精雕細(xì)琢反復(fù)測(cè)試,那沒(méi)問(wèn)題;單上路實(shí)測(cè),就只能看天吃飯了。
端到端能解嗎?
“遇事不決量子力學(xué)”,是一句調(diào)侃。
但在自動(dòng)駕駛領(lǐng)域,遇事不決,的確都可以“端到端”一下。
所謂“端到端”是針對(duì)傳統(tǒng)技術(shù)范式而言的,其中自動(dòng)駕駛的感知、決策、規(guī)控等等互相獨(dú)立。傳感器采集到的數(shù)據(jù),需要通過(guò)這一系列不同的算法模塊,最終才能“變成”操作指令。
每個(gè)獨(dú)立模塊之間的信息是逐級(jí)傳遞的,在這個(gè)過(guò)程中必然會(huì)存在信息的丟失和誤差,而且前一個(gè)模塊的誤差會(huì)影響到下一個(gè),多個(gè)模塊之間的信息誤差會(huì)不斷累積,進(jìn)而影響到自動(dòng)駕駛方案的整體效果。
無(wú)論是純視覺(jué)感知,還是融合感知,“錯(cuò)檢漏檢”的根源就在這里。
當(dāng)然也有對(duì)應(yīng)的解決辦法,那就是通過(guò)人手寫(xiě)的規(guī)則,盡量打補(bǔ)丁提高感知識(shí)別的可靠性。比如能識(shí)別車、人,但識(shí)別不了“人站在車前”,那好辦,直接將這類目標(biāo)單獨(dú)建一個(gè)數(shù)據(jù)集拿來(lái)訓(xùn)練模型不就行了?
這就是所謂感知“白名單”機(jī)制。
但問(wèn)題是,很難窮舉所有種類的交通目標(biāo)和場(chǎng)景,這次解決了“人在車前”的問(wèn)題,但如果車從乘用車變成大卡車呢?或者一個(gè)人變成大人牽小孩呢?
對(duì)于 Robotaxi 的建筑工地難題來(lái)說(shuō)也是一樣,工地可能臨時(shí)出現(xiàn),隨機(jī)刷新,不會(huì)限定區(qū)域限定時(shí)間,而每家工地的搭建、施工路障都不一樣…
所以從感知開(kāi)始就實(shí)現(xiàn)信息的無(wú)損傳遞,讓系統(tǒng)真正理解環(huán)境,需要有一個(gè)全新的算法范式 —— 端到端算法模型。
兩個(gè)端分別指數(shù)據(jù)輸入端和指令輸出端,中間不再分成幾個(gè)相互獨(dú)立的模塊。
端到端模型能夠通過(guò)完全數(shù)據(jù)驅(qū)動(dòng)的模式,將其學(xué)到的能力和技巧遷移泛化到其他場(chǎng)景當(dāng)中,自主且高效解決行泊場(chǎng)景中新出現(xiàn)的各類長(zhǎng)尾問(wèn)題,具備更快的迭代效率,有效降低開(kāi)城成本。
通俗的說(shuō),就是讓 AI 司學(xué)習(xí)人類成熟駕駛行為,看到一種場(chǎng)景,做出相應(yīng)對(duì)策。實(shí)際上“端到端”已經(jīng)摸到了 AGI 的門檻。
2016 年端到端模型由英偉達(dá)首次提出。但真正得到量產(chǎn)實(shí)踐這兩年才開(kāi)始。目前只有特斯拉的 FSD 和中國(guó) AI 玩家的 CVPR 2023 最佳論文 ——UniAD。
智能車參考也分別就 Waymo 遇到的工地難題詢問(wèn)了這兩家國(guó)內(nèi)自動(dòng)駕駛頭部玩家的看法。
地平線從工程實(shí)踐角度出發(fā),認(rèn)為:
自動(dòng)駕駛的工地難題和端到端技術(shù)范式并不是綁定的。理論上講,感知能力足夠強(qiáng)、感知白名單足夠豐富也是能解決問(wèn)題的。
但顯然,端到端的自主學(xué)習(xí)能力、類人思考會(huì)更大規(guī)模更高效率的解決這個(gè)問(wèn)題。
而商湯的看法更加從“第一性原理”出發(fā),絕影智駕相關(guān)技術(shù)專家相關(guān)認(rèn)為:
不對(duì)具體的 case 進(jìn)行評(píng)價(jià)。但基于規(guī)則的傳統(tǒng)智駕方案的感知還是人為定義要素,并對(duì)感知信息進(jìn)行抽象提取,這就會(huì)導(dǎo)致信息傳遞過(guò)程的損失和遺漏,讓感知決策模塊難以作出正確的決策。而端到端是在一個(gè)神經(jīng)網(wǎng)絡(luò)中,將外部環(huán)境的信息無(wú)損輸入和傳遞,更準(zhǔn)確和完整地理解外部交通環(huán)境,并作出規(guī)劃和決策。
規(guī)則方案可以通過(guò)增加規(guī)則、添加補(bǔ)丁解決一個(gè)場(chǎng)景。但是這樣的場(chǎng)景不會(huì)只有一個(gè),是無(wú)限的。而足夠多的數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練之后,端到端方案可以像人一樣思考、開(kāi)車,自己解決更多類似的 corner case。
總結(jié)一下,地平線和商湯表述不同,但核心一樣,都認(rèn)可端到端是解決 Robotaxi 工地難題最有效的方法。同時(shí)還是解決自動(dòng)駕駛各類長(zhǎng)尾問(wèn)題的最高效途徑。
對(duì)了多說(shuō)一句,提出 UniAD 的 CVPR 2023 最佳論文,地平線和商湯的學(xué)者都參與了撰寫(xiě)。
端到端對(duì)傳統(tǒng)技術(shù)范式革新,給了所有玩家新的機(jī)遇:更好的智駕體驗(yàn)、更低的維護(hù)、泛化成本,以及更有競(jìng)爭(zhēng)力的自動(dòng)駕駛方案成本。
但代價(jià)是以往模塊化的、規(guī)則驅(qū)動(dòng)主導(dǎo)的技術(shù)體系,必須推倒重構(gòu)。
昔日自動(dòng)駕駛絕對(duì)領(lǐng)軍者 Waymo,如今陷入“建筑工地”困境中,更加證明自動(dòng)駕駛這條賽道“水無(wú)常形,兵無(wú)常勢(shì)”:
老牌明星可能會(huì)優(yōu)勢(shì)歸零重置,“后來(lái)者”也會(huì)獲得領(lǐng)先優(yōu)勢(shì)。
本文來(lái)自微信公眾號(hào):智能車參考 (ID:AI4Auto),作者:有車有據(jù)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。