首頁(yè) > 智車之家>車用技術(shù)

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

智能車參考 2024/5/19 14:56:36 責(zé)編：清源

評(píng)論：

Robotaxi，防火防盜防“建筑工地”。Waymo 就栽了。

北美監(jiān)管部門剛剛又開(kāi)啟了針對(duì) Waymo 無(wú)人車的調(diào)查，起因是收到一系列相關(guān)事故報(bào)告。

有撞上路邊停放車輛的，有撞靜止障礙物的，阻塞交通的… 以及一個(gè)不尋常高頻場(chǎng)景：建筑工地。

發(fā)生了什么

大概 3 個(gè)月內(nèi)，Waymo 積累上報(bào)了 22 起事故，引起了美國(guó)國(guó)家公路交通安全管理局的注意。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

根據(jù) NHTSA 的文件顯示，這些事故包括 Waymo 無(wú)人車和靜止和半靜止物體（比如門）相撞、與停放車輛相撞以及違反交通安全控制裝置的情況。

其中“違反交通安全控制裝置”官方特別說(shuō)明是一個(gè)重點(diǎn)調(diào)查方向，一個(gè)典型場(chǎng)景就是自動(dòng)駕駛系統(tǒng)對(duì)交通錐 / 雪糕筒的檢測(cè)識(shí)別能力。

這個(gè)點(diǎn)比較罕見(jiàn)。因?yàn)檫@次上報(bào)的 22 起事故中，很多都涉及同一種場(chǎng)景 —— 建筑工地。

比如上個(gè)月，6 輛編隊(duì)行駛的 Waymo Robotaxi，下班收工回停車場(chǎng)，結(jié)果遇到了施工現(xiàn)場(chǎng)臨時(shí)交通管制，直接卡死在雪糕筒圍成的臨時(shí)通行區(qū)，造成了大約半個(gè)小時(shí)交通擁堵。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

有本地生活經(jīng)驗(yàn)的網(wǎng)友立刻就認(rèn)出來(lái)，這是舊金山 Potrero 大道 101 號(hào)匝道，Waymo 無(wú)人車卡死的地方，剛好是高速入口。

最后，是路上的司機(jī)老哥直接下車手動(dòng)挪開(kāi)雪糕筒，后面的車隊(duì)依次繞過(guò)幾輛“癱瘓”的無(wú)人車。

Waymo 方面出了一個(gè)簡(jiǎn)單聲明，大意是 30 分鐘內(nèi)就派人去現(xiàn)場(chǎng)挪車了，沒(méi)有造成任何傷亡和財(cái)產(chǎn)損失，后續(xù)會(huì)配合調(diào)查。

不過(guò)在鳳凰城的建筑工地，就沒(méi)這么幸運(yùn)了。

同樣一輛 Waymo 無(wú)人車，無(wú)視了雪糕筒圍出的施工區(qū)域，直接沖進(jìn)了建筑工地。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

幸好速度不快沒(méi)撞到人，不過(guò)車輛本身、工地現(xiàn)場(chǎng)都有不同程度損失。

類似這樣的事故很多，每次無(wú)人車“沖進(jìn)工地”的小視頻，都會(huì)在網(wǎng)絡(luò)上瘋傳。

網(wǎng)友總結(jié)的很生動(dòng)：交通錐就是 Robotaxi 的氪石（kryptonite），現(xiàn)在再神通廣大的自動(dòng)駕駛，遇到封閉道路的交通錐，都得完蛋。

咦？好像跟 Waymo 官方秀出的視頻不太一樣呀。

為什么建筑工地難？

Waymo 第五代自動(dòng)駕駛系統(tǒng)繞行施工區(qū)，曾被當(dāng)做技術(shù)亮點(diǎn)專門解析過(guò)。

官方的 Demo 中，無(wú)人車面對(duì)的場(chǎng)景更加復(fù)雜，除了交通錐、不規(guī)則區(qū)域，還有來(lái)回走動(dòng)的工人。

Waymo 無(wú)人車當(dāng)然是毫不費(fèi)力完成了一系列避讓、繞行動(dòng)作，順利通過(guò)了施工區(qū)域：

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

這里面讓人嘖嘖稱奇的是，Waymo 無(wú)人車似乎能夠看懂人類指揮交通的肢體語(yǔ)言，讓停就停，讓走就走，而不僅僅以路面條件作為依據(jù)。

怎么做到的？Waymo 負(fù)責(zé)預(yù)測(cè)算法的工程師 Maya Kabkab 簡(jiǎn)要解釋了一下，大意是第五代技術(shù)中，Waymo 加強(qiáng)了對(duì)不同物體目標(biāo)的理解能力，以及對(duì)可通行區(qū)域的識(shí)別能力，這兩項(xiàng)使得系統(tǒng)能更好規(guī)劃通行路線。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

核心是用全新模型 VectorNet 替代 CNN，提取傳感器和高精地圖信息。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

簡(jiǎn)單的說(shuō)，是將高精地圖和傳感器輸入信息表示為點(diǎn)、多邊形或曲線，VectorNet 則將所有道路特征和其他對(duì)象的軌跡表示為相應(yīng)的向量?；谶@個(gè)簡(jiǎn)化的視圖，VectorNet 可以提取每個(gè)向量的信息以及學(xué)習(xí)不同向量之間的關(guān)系。

好處是 VectorNet 比 CNN 占用計(jì)算資源更少，出結(jié)果的速度更快，理論上也能更加清晰的提取出關(guān)鍵場(chǎng)景信息。

但 VectorNet 仍然沒(méi)有解決“建筑工地”難題的核心 ——

“建筑工地”本身是高精地圖的例外，不可能同步更新，只能靠傳感器實(shí)時(shí)感知。
但傳感器的數(shù)據(jù)在不同子模型之間依次傳遞，信息損失難以完全避免。

Robotaxi 頻繁出現(xiàn)被建筑工地卡死，直接原因是對(duì)交通錐、異形物的錯(cuò)檢漏檢。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

而深層原因，是傳統(tǒng)自動(dòng)駕駛技術(shù)范式存在能力的上限、天花板，難以覆蓋路上所有的 corner case。

所以能不能順利避讓建筑工地，成了一種概率事件：官方 Demo 精雕細(xì)琢反復(fù)測(cè)試，那沒(méi)問(wèn)題；單上路實(shí)測(cè)，就只能看天吃飯了。

端到端能解嗎？

“遇事不決量子力學(xué)”，是一句調(diào)侃。

但在自動(dòng)駕駛領(lǐng)域，遇事不決，的確都可以“端到端”一下。

所謂“端到端”是針對(duì)傳統(tǒng)技術(shù)范式而言的，其中自動(dòng)駕駛的感知、決策、規(guī)控等等互相獨(dú)立。傳感器采集到的數(shù)據(jù)，需要通過(guò)這一系列不同的算法模塊，最終才能“變成”操作指令。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

每個(gè)獨(dú)立模塊之間的信息是逐級(jí)傳遞的，在這個(gè)過(guò)程中必然會(huì)存在信息的丟失和誤差，而且前一個(gè)模塊的誤差會(huì)影響到下一個(gè)，多個(gè)模塊之間的信息誤差會(huì)不斷累積，進(jìn)而影響到自動(dòng)駕駛方案的整體效果。

無(wú)論是純視覺(jué)感知，還是融合感知，“錯(cuò)檢漏檢”的根源就在這里。

當(dāng)然也有對(duì)應(yīng)的解決辦法，那就是通過(guò)人手寫(xiě)的規(guī)則，盡量打補(bǔ)丁提高感知識(shí)別的可靠性。比如能識(shí)別車、人，但識(shí)別不了“人站在車前”，那好辦，直接將這類目標(biāo)單獨(dú)建一個(gè)數(shù)據(jù)集拿來(lái)訓(xùn)練模型不就行了？

這就是所謂感知“白名單”機(jī)制。

但問(wèn)題是，很難窮舉所有種類的交通目標(biāo)和場(chǎng)景，這次解決了“人在車前”的問(wèn)題，但如果車從乘用車變成大卡車呢？或者一個(gè)人變成大人牽小孩呢？

對(duì)于 Robotaxi 的建筑工地難題來(lái)說(shuō)也是一樣，工地可能臨時(shí)出現(xiàn)，隨機(jī)刷新，不會(huì)限定區(qū)域限定時(shí)間，而每家工地的搭建、施工路障都不一樣…

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

所以從感知開(kāi)始就實(shí)現(xiàn)信息的無(wú)損傳遞，讓系統(tǒng)真正理解環(huán)境，需要有一個(gè)全新的算法范式 —— 端到端算法模型。

兩個(gè)端分別指數(shù)據(jù)輸入端和指令輸出端，中間不再分成幾個(gè)相互獨(dú)立的模塊。

端到端模型能夠通過(guò)完全數(shù)據(jù)驅(qū)動(dòng)的模式，將其學(xué)到的能力和技巧遷移泛化到其他場(chǎng)景當(dāng)中，自主且高效解決行泊場(chǎng)景中新出現(xiàn)的各類長(zhǎng)尾問(wèn)題，具備更快的迭代效率，有效降低開(kāi)城成本。

通俗的說(shuō)，就是讓 AI 司學(xué)習(xí)人類成熟駕駛行為，看到一種場(chǎng)景，做出相應(yīng)對(duì)策。實(shí)際上“端到端”已經(jīng)摸到了 AGI 的門檻。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

2016 年端到端模型由英偉達(dá)首次提出。但真正得到量產(chǎn)實(shí)踐這兩年才開(kāi)始。目前只有特斯拉的 FSD 和中國(guó) AI 玩家的 CVPR 2023 最佳論文 ——UniAD。

智能車參考也分別就 Waymo 遇到的工地難題詢問(wèn)了這兩家國(guó)內(nèi)自動(dòng)駕駛頭部玩家的看法。

地平線從工程實(shí)踐角度出發(fā)，認(rèn)為：

自動(dòng)駕駛的工地難題和端到端技術(shù)范式并不是綁定的。理論上講，感知能力足夠強(qiáng)、感知白名單足夠豐富也是能解決問(wèn)題的。
但顯然，端到端的自主學(xué)習(xí)能力、類人思考會(huì)更大規(guī)模更高效率的解決這個(gè)問(wèn)題。

而商湯的看法更加從“第一性原理”出發(fā)，絕影智駕相關(guān)技術(shù)專家相關(guān)認(rèn)為：

不對(duì)具體的 case 進(jìn)行評(píng)價(jià)。但基于規(guī)則的傳統(tǒng)智駕方案的感知還是人為定義要素，并對(duì)感知信息進(jìn)行抽象提取，這就會(huì)導(dǎo)致信息傳遞過(guò)程的損失和遺漏，讓感知決策模塊難以作出正確的決策。而端到端是在一個(gè)神經(jīng)網(wǎng)絡(luò)中，將外部環(huán)境的信息無(wú)損輸入和傳遞，更準(zhǔn)確和完整地理解外部交通環(huán)境，并作出規(guī)劃和決策。
規(guī)則方案可以通過(guò)增加規(guī)則、添加補(bǔ)丁解決一個(gè)場(chǎng)景。但是這樣的場(chǎng)景不會(huì)只有一個(gè)，是無(wú)限的。而足夠多的數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練之后，端到端方案可以像人一樣思考、開(kāi)車，自己解決更多類似的 corner case。

總結(jié)一下，地平線和商湯表述不同，但核心一樣，都認(rèn)可端到端是解決 Robotaxi 工地難題最有效的方法。同時(shí)還是解決自動(dòng)駕駛各類長(zhǎng)尾問(wèn)題的最高效途徑。

對(duì)了多說(shuō)一句，提出 UniAD 的 CVPR 2023 最佳論文，地平線和商湯的學(xué)者都參與了撰寫(xiě)。

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

端到端對(duì)傳統(tǒng)技術(shù)范式革新，給了所有玩家新的機(jī)遇：更好的智駕體驗(yàn)、更低的維護(hù)、泛化成本，以及更有競(jìng)爭(zhēng)力的自動(dòng)駕駛方案成本。

但代價(jià)是以往模塊化的、規(guī)則驅(qū)動(dòng)主導(dǎo)的技術(shù)體系，必須推倒重構(gòu)。

昔日自動(dòng)駕駛絕對(duì)領(lǐng)軍者 Waymo，如今陷入“建筑工地”困境中，更加證明自動(dòng)駕駛這條賽道“水無(wú)常形，兵無(wú)常勢(shì)”：

老牌明星可能會(huì)優(yōu)勢(shì)歸零重置，“后來(lái)者”也會(huì)獲得領(lǐng)先優(yōu)勢(shì)。

本文來(lái)自微信公眾號(hào)：智能車參考（ID：AI4Auto），作者：有車有據(jù)

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

建筑工地成無(wú)人車“噩夢(mèng)”，谷歌 Waymo 栽跟頭多到被約談

發(fā)生了什么

為什么建筑工地難？

端到端能解嗎？

相關(guān)文章

為什么建筑工地難？