新智元報(bào)道
編輯:編輯部
【新智元導(dǎo)讀】爆火全網(wǎng)的炒蝦機(jī)器人震撼升級(jí)了!斯坦福聯(lián)手 DeepMind 開(kāi)源升級(jí)版 ALOHA 2,全新的機(jī)器人不僅能戴隱形眼鏡、開(kāi)可樂(lè),甚至還可以開(kāi)錢(qián)包抽鈔票!這種級(jí)別的精細(xì)控制簡(jiǎn)直神了……
一個(gè)月前,斯坦福爆火炒菜機(jī)器人 Mobile ALOHA,在今天全新升級(jí)二代 ALOHA 2!
先不說(shuō)別的,就「戴隱形眼鏡」這項(xiàng)任務(wù),至今還沒(méi)有哪個(gè)機(jī)器人敢于發(fā)起挑戰(zhàn)。
看 ALOHA 2 這雙靈巧的雙手,先把一層薄如紙的外包裝撕開(kāi),完整取出隱形眼鏡。
大眼熊貓玩偶成為第一個(gè)受試者,只見(jiàn) ALOHA 2 往眼珠子上一按,隱性眼鏡一下子就上去了。(就是眼珠子可能會(huì)有點(diǎn)疼)
「小偷機(jī)器人」ALOHA 2 還能在當(dāng)事人聊的正投入時(shí),可以囊中取物。
悄悄地把錢(qián)夾子拿出來(lái),抽出幾張美鈔,然后再偷偷地放回口袋。
不過(guò),最后還是被發(fā)現(xiàn)了!
要說(shuō)這整(zuo)活(si)的程度,連「擎天柱」都自愧不如。
空中拋玩偶,一手扔,一手接,也是 6 的一批。
就看這隨手撬開(kāi)小小的可樂(lè)拉環(huán)那一幕,絕對(duì)瀟灑!
還有,將各種水果蔬菜模具進(jìn)行分類(lèi)這樣的簡(jiǎn)單任務(wù),更是拿捏自如。
ALOHA 2 這番炫技,再次驚艷了眾人。當(dāng)然,以上這些畫(huà)面,都是遠(yuǎn)程操作完成的。
事情發(fā)展得太快了,真可怕!
有網(wǎng)友直接點(diǎn)名,下次想看 ALOHA 變魔術(shù)?。ù颂?@谷歌斯坦福團(tuán)隊(duì),趕快安排?。?/p>
這次,與以往不同的是,谷歌 DeepMind 也下場(chǎng)了,一起聯(lián)手斯坦福、Hoku Labs「明星團(tuán)隊(duì)」推出 ALOHA 2!
據(jù)介紹,ALOHA 2 是一種用于雙手遠(yuǎn)程操作的增強(qiáng)型低成本硬件,大幅提升了初代 ALOHA 的耐用性,能夠在更復(fù)雜的任務(wù)上進(jìn)行大規(guī)模的數(shù)據(jù)收集。
更驚喜的是,ALOHA 2 此次的打造成本僅為 27,067.50 美元(約 19 萬(wàn)),比第一代還要便宜 3 萬(wàn)元。
詳單:
與往常一樣,機(jī)器人 ALOHA 2 硬件手把手教程,以及代碼全部開(kāi)源!
爆打初代 ALOHA,更靈敏反應(yīng)更快
研究人員把 ALOHA 2 組成一支「艦隊(duì)」,場(chǎng)面堪稱(chēng)壯觀。
這一次,全新 ALOHA 2 與第一代機(jī)器人,升級(jí)點(diǎn)在哪里?
首先是機(jī)械手,團(tuán)隊(duì)把它們改造得抓取性能更好、更堅(jiān)固。
甚至,團(tuán)隊(duì)還更改了抓握膠帶的布局,以改善機(jī)器人對(duì)小物體的抓握能力。
我們剛剛看到的,ALOHA 2 撕開(kāi)隱形眼鏡包裝,扣開(kāi)可樂(lè)罐等微小物體的操作能力上表現(xiàn)出色。
當(dāng)然了,ALOHA 2 也它不可以的時(shí)候,比如打開(kāi)這盒牛奶,費(fèi)了很大勁。
在 16 倍慢速的情況下,看分別這兩個(gè)抓手的響應(yīng)速度,很明顯 ALOHA 2 更快,初代 ALOHA 才一點(diǎn)點(diǎn)合并。
在引導(dǎo)側(cè),還是使用了相同的導(dǎo)軌設(shè)計(jì)。
不過(guò),為了進(jìn)一步改善人體工程學(xué),團(tuán)隊(duì)用更易于反向驅(qū)動(dòng)的低齒比伺服器,取代了原來(lái)的伺服器。
這樣一來(lái),操作員在打開(kāi)夾具時(shí)需要克服的摩擦力,就減少了 10 倍之多!
還有 Follower 夾持器的抓取力,采用了低摩擦導(dǎo)軌設(shè)計(jì),可以將 2 倍以上的力傳遞到夾持器尖端。
從下圖可以看出,ALOHA 2 比初代抓手能力提升了 2 倍,峰值為 30.1N。
接下來(lái),團(tuán)隊(duì)還改進(jìn)了引臂的重力補(bǔ)償功能。
通過(guò)恒力牽引器(constant-force retractors)和彈簧滑輪系統(tǒng),這個(gè)手臂可以在大多數(shù)地方「漂浮」。
比起原來(lái)的橡皮筋,它可耐用多了!
最后,團(tuán)隊(duì)簡(jiǎn)化了工作單元周?chē)目蚣?,同時(shí)保持了攝像機(jī)安裝點(diǎn)的剛性。
這就既為人機(jī)合作者開(kāi)辟了空間,也為機(jī)器人與道具互動(dòng)開(kāi)辟了空間。
虛擬世界中的 ALOHA 執(zhí)行任務(wù)
甚至,即使沒(méi)有硬件,我們都可以在 Mujoco 中使用 ALOHA 執(zhí)行復(fù)雜的任務(wù)!
因?yàn)閳F(tuán)隊(duì)發(fā)布了一個(gè)帶有 SysID 的 ALOHA sim 模型。
它可以將盤(pán)子,精準(zhǔn)地放回收納架中。
換只手拎大錘,交替自然。
平底鍋炒「空氣」,也能意思一下。
整理收納桌上的物品,一只手接,一只手放。
ALOHA 2 的重大改進(jìn)
這次的 ALOHA 2,繼承了 ALOHA 的原始設(shè)計(jì),由一個(gè)雙臂并聯(lián)加持工作單元(包含兩個(gè) ViperX 6-DoF 手臂)和兩個(gè)更小的 WidowX 手臂組成。
前者是從動(dòng)(follower),后者是主控(leader)。
WidowX 與 ViperX 有相同的運(yùn)動(dòng)結(jié)構(gòu),只是體積更小。
從動(dòng)的關(guān)節(jié)動(dòng)作與主控臂同步,用戶(hù)可以通過(guò)操作主控臂,來(lái)遠(yuǎn)程控制從動(dòng)臂,就跟提線木偶一樣。
此外,系統(tǒng)還配備了多個(gè)攝像頭,可以從多個(gè)角度捕捉圖像,這樣就可以在遠(yuǎn)程操作期間收集 RGB 數(shù)據(jù)。
機(jī)器人安裝在一個(gè) 48 英寸 x30 英寸的桌子上,周?chē)幸粋€(gè)鋁制保護(hù)框架,它不僅為攝像頭提供了額外的安裝點(diǎn),還集成了重力補(bǔ)償系統(tǒng)。
為了支持復(fù)雜操控任務(wù)的研究,團(tuán)隊(duì)計(jì)劃在 ALOHA 平臺(tái)上大幅擴(kuò)展數(shù)據(jù)收集的規(guī)模,包括增加機(jī)器人的數(shù)量、每臺(tái)機(jī)器人的數(shù)據(jù)收集時(shí)長(zhǎng)以及數(shù)據(jù)收集的多樣性。
因此,團(tuán)隊(duì)的目標(biāo)相對(duì)于第一代 ALOHA 平臺(tái),就有了一些變化,在以下幾方面做了改進(jìn) ——
- 性能與任務(wù)范圍:提升 ALOHA 關(guān)鍵組件的性能,如夾持器和控制系統(tǒng),以支持更多樣的操控任務(wù)。
- 用戶(hù)友好性與人體工程學(xué):為了使數(shù)據(jù)收集工作更加高效,這次團(tuán)隊(duì)將用戶(hù)的體驗(yàn)和舒適度放在首位,對(duì)系統(tǒng)的響應(yīng)速度和人體工程學(xué)設(shè)計(jì)進(jìn)行了優(yōu)化。
- 系統(tǒng)魯棒性:團(tuán)隊(duì)簡(jiǎn)化了機(jī)械設(shè)計(jì),確保了更大規(guī)模機(jī)器人群的易于維護(hù),這樣就可以提高系統(tǒng)的魯棒性,減少因故障診斷和修理導(dǎo)致的停機(jī)時(shí)間。
為了實(shí)現(xiàn)這些目標(biāo),團(tuán)隊(duì)在夾持器、重力補(bǔ)償、架構(gòu)、攝像頭、模擬等方面都進(jìn)行了改進(jìn)。
可以看到,通過(guò)這些改進(jìn),操作者可以更輕松地對(duì)一些挑戰(zhàn)性任務(wù)進(jìn)行遠(yuǎn)程控制,比如疊 T 恤、打結(jié)、拋擲物體,甚至是精度要求極高的工業(yè)作業(yè)。
現(xiàn)在,每臺(tái)機(jī)器人每天都能在這些任務(wù)上完成數(shù)百次的演練,效率大幅提升。
硬件
主控夾持器(Leader,操作者手持的設(shè)備)
為了實(shí)現(xiàn)更流暢的遠(yuǎn)程操作體驗(yàn)和更好的人體工程學(xué)設(shè)計(jì),團(tuán)隊(duì)將 ALOHA 的原始剪刀型夾持器設(shè)計(jì),替換成了一種低摩擦軌道設(shè)計(jì),這就顯著降低了機(jī)械復(fù)雜度。
為了進(jìn)一步減輕操作者的負(fù)擔(dān),團(tuán)隊(duì)還把原來(lái)的夾持器電機(jī)更換為摩擦更小的型號(hào),這種電機(jī)齒輪比更低,且采用了低摩擦金屬齒輪代替了塑料齒輪。
這種新設(shè)計(jì),就使開(kāi)啟和關(guān)閉夾持器的力量需求減少到原來(lái)的十分之一。這就顯著降低了操作者在長(zhǎng)時(shí)間采集數(shù)據(jù)時(shí)的手部疲勞和壓力。
在決定采用線性軌道設(shè)計(jì)時(shí),團(tuán)隊(duì)對(duì)比了另外兩種設(shè)計(jì)方案。
首先是 ALOHA 中采用的原始剪刀型設(shè)計(jì),它通過(guò)定制的 3D 打印轉(zhuǎn)子和軌道來(lái)實(shí)現(xiàn)夾持器電機(jī)的反向驅(qū)動(dòng)。
另外還有一種帶彈簧的扳機(jī)設(shè)計(jì),拉動(dòng)扳機(jī)時(shí),夾持器就關(guān)上,如果放開(kāi),它就回到自然的開(kāi)放狀態(tài)。
團(tuán)隊(duì)找來(lái) 6 名用戶(hù),用這三種裝置通過(guò)遠(yuǎn)程操控拆開(kāi)糖果包裝。
結(jié)果顯示,用戶(hù)的偏好各不相同,但幾乎所有人都給線性軌道設(shè)計(jì)投了一票。
從動(dòng)夾持器(Follower,操縱物體的機(jī)器手)
在 ALOHA 2 中,團(tuán)隊(duì)把機(jī)器人的「手指」也改良了。
這種新型夾持器摩擦力更低,這就減少了操作者與機(jī)器人「手指」之間的反應(yīng)延遲,極大提升了用戶(hù)體驗(yàn),從視頻中可以看出,新設(shè)計(jì)在反應(yīng)時(shí)間上大大加快。
這副新手也讓夾持器的力量達(dá)到了舊款的 2 倍,抓物體更牢了。
而原有的 PLA 和丙烯酸結(jié)構(gòu),被替代為了 3D 打印的碳纖維尼龍材料,這就提高了「手」的柔韌性 —— 承受重載時(shí),它能適度彎曲,讓操作更安全。
這次,團(tuán)隊(duì)保留了 ALOHA 手指關(guān)節(jié)的透明設(shè)計(jì)。在夾持器內(nèi)側(cè)使用了聚氨酯抓握帶,并在手指外側(cè)增加了膠帶,因而提升了抓握力。
重力補(bǔ)償 —— 被動(dòng)系統(tǒng)
為了減輕遠(yuǎn)程操控的疲勞感,團(tuán)隊(duì)還設(shè)計(jì)了一種「重力補(bǔ)償」機(jī)制 —— 通過(guò)可調(diào)節(jié)的懸掛式緩沖器,人類(lèi)操作者就可以根據(jù)自己的舒適度調(diào)整平衡力。
研究人員對(duì)比了被動(dòng)硬件重力補(bǔ)償系統(tǒng),與一個(gè)基于軟件的主動(dòng)補(bǔ)償系統(tǒng)的差異。
簡(jiǎn)單來(lái)說(shuō),「重力補(bǔ)償」就是保證機(jī)器人移動(dòng)手臂之后,依然能夠保持在一個(gè)位置上不動(dòng)。
「主動(dòng)系統(tǒng)」利用 MuJoCo 模型的逆向動(dòng)力學(xué)。計(jì)算出重力負(fù)載的等效扭矩,然后將扭矩命令傳遞給主控機(jī)器人的關(guān)節(jié)。
為了展開(kāi)這項(xiàng)研究,6 位用戶(hù)通過(guò)遠(yuǎn)程操控機(jī)器人,嘗試在 10 分鐘內(nèi)完成一個(gè)精確的任務(wù)。
即,將不同形狀的物體插入盒子中相應(yīng)的孔中。操作員以隨機(jī)分配的順序在兩個(gè)系統(tǒng)上嘗試執(zhí)行任務(wù)。
結(jié)果發(fā)現(xiàn),平均而言,操作員使用被動(dòng)重力補(bǔ)償系統(tǒng)表現(xiàn)更好(每分鐘插入 1.38 個(gè)形狀,相比之下主動(dòng)系統(tǒng)為 0.97 個(gè))。
根據(jù)參與者的反饋,作者推測(cè)「被動(dòng)系統(tǒng)」能夠提供更平穩(wěn)、可預(yù)測(cè)的操作體驗(yàn)。
然而,「主動(dòng)系統(tǒng)」操作起來(lái)需要更多力量,且動(dòng)作更為生硬,可能是因?yàn)樗欧姍C(jī)調(diào)節(jié)不當(dāng),或是在抵抗重力時(shí)存在輕微的延遲。
此外,「被動(dòng)系統(tǒng)」還有 2 個(gè)額外的優(yōu)點(diǎn):
1. 通過(guò)完全關(guān)閉主控機(jī)器人關(guān)節(jié)的動(dòng)力,可以避免軟件錯(cuò)誤或異常情況下的意外大幅移動(dòng),從而實(shí)現(xiàn)更安全的遠(yuǎn)程操作;
2. 力牽引器讓機(jī)械臂自然居中,避免了手腕過(guò)度旋轉(zhuǎn),這是主動(dòng)補(bǔ)償系統(tǒng)的一個(gè)弱點(diǎn)。
由此,在 ALOHA 2 項(xiàng)目,研究人員選擇了「被動(dòng)系統(tǒng)」。
不過(guò),他們認(rèn)為,經(jīng)過(guò)適當(dāng)?shù)拈_(kāi)發(fā)和調(diào)試,一個(gè)「主動(dòng)系統(tǒng)」可能會(huì)超越「被動(dòng)系統(tǒng)」的性能,并可能擴(kuò)展一些有用的功能,比如為用戶(hù)提供觸覺(jué)反饋。
4 個(gè)攝像頭
研究人員還把 ALOHA 系統(tǒng)中的攝像頭,升級(jí)為 4 個(gè) RealSense D405 攝像頭。
它們不僅體積小巧,還能提供高分辨率的彩色圖像和深度信息,并且提供全局快門(mén)功能。
研究人員還為腕式相機(jī)和頂部以及低角度視角設(shè)計(jì)了新的支架(參見(jiàn)圖 6)。
腕式相機(jī)的緊湊設(shè)計(jì)顯著減少了可能的碰撞風(fēng)險(xiǎn)。
對(duì)于那些需要精細(xì)操作的任務(wù)來(lái)說(shuō),特別是在手臂需要緊密配合或在狹小空間內(nèi)操作時(shí),這種設(shè)計(jì)顯著提升了遠(yuǎn)程操控的效果。
遠(yuǎn)程操作
ALOHA 2 的遠(yuǎn)程操作,是如何實(shí)現(xiàn)的呢?
研究人員利用 ROS2 來(lái)運(yùn)行遠(yuǎn)程操作軟件棧。
啟動(dòng)時(shí),主控臂和從動(dòng)臂( leader & follower arms)都會(huì)初始化到初始位置。操作員可以通過(guò)操作任一主控機(jī)器人上的夾持器手指部件來(lái)啟動(dòng)數(shù)據(jù)收集會(huì)話。
通過(guò)操作工作單元下方的腳踏板,操作員能夠保存或放棄該會(huì)話。
在遠(yuǎn)程操作會(huì)話中,研究人員記錄了包括圖像、主控臂和從動(dòng)臂關(guān)節(jié)位置,以及 ROS2 系統(tǒng)提供的其他輔助數(shù)據(jù)在內(nèi)的機(jī)器人傳感器數(shù)據(jù)流。
為了確保下游處理流程能接收到完整、高質(zhì)量的數(shù)據(jù),他們還在數(shù)據(jù)收集時(shí)采取了多項(xiàng)措施,這對(duì)機(jī)器人學(xué)習(xí)流程至關(guān)重要。
操作員在數(shù)據(jù)收集過(guò)程中能夠看到傳感器可用性和延遲等會(huì)話統(tǒng)計(jì)信息,以確保數(shù)據(jù)的可靠記錄。
為了保證下游學(xué)習(xí)流程始終獲得完整數(shù)據(jù),一旦發(fā)現(xiàn)數(shù)據(jù)缺失,會(huì)話將自動(dòng)終止。
記錄會(huì)話時(shí),研究人員會(huì)記錄操作員用戶(hù)名、時(shí)間和機(jī)器人標(biāo)識(shí)符,以及機(jī)器人的原始傳感器數(shù)據(jù)流。
此外,還會(huì)記錄額外的數(shù)據(jù),以便在后期發(fā)現(xiàn)某些機(jī)器人在特定時(shí)間段內(nèi)存在問(wèn)題時(shí)能夠進(jìn)行數(shù)據(jù)過(guò)濾。
模擬
這次,團(tuán)隊(duì)還推出了 ALOHA 2 工作站的一個(gè)模擬版本,這個(gè)版本基于 MuJoCo Menagerie 技術(shù),對(duì)遠(yuǎn)程操控和在虛擬環(huán)境中的學(xué)習(xí)非常有幫助。
比起之前的 ALOHA 模型,這個(gè)新模型在模擬物理行為和視覺(jué)效果上,都有顯著提升。
通過(guò)分析真實(shí)的 ALOHA 2 操作軌跡,就可以調(diào)整模擬模型中的物理參數(shù),使它更貼近現(xiàn)實(shí)。
在實(shí)驗(yàn)中,研究者記錄了使用主控臂進(jìn)行的 11 次操作軌跡,通過(guò)專(zhuān)門(mén)的計(jì)算方法,減少了這些真實(shí)軌跡與模擬軌跡之間的差異。
在這個(gè)過(guò)程中,研究者調(diào)整了模擬中位置控制元件的一系列參數(shù),包括動(dòng)作的比例控制、阻力、連接部分的摩擦力和扭力限制等。
為了讓模擬效果更加逼真,研究者盡可能模仿了真實(shí)設(shè)備的相機(jī)設(shè)置(參看下圖的模擬相機(jī)視角),并且還原了工作臺(tái)及其邊緣部件、從動(dòng)夾持器的細(xì)節(jié)。
這個(gè)超級(jí)逼真的模型,就可以讓人們通過(guò) ALOHA 2 WidowX 主控設(shè)備,以快速、直觀、易擴(kuò)展的方式收集模擬數(shù)據(jù)。
這樣一個(gè)開(kāi)源的高品質(zhì)模型,就可以結(jié)合精確的系統(tǒng)參數(shù)設(shè)定,促進(jìn)不同機(jī)構(gòu)間共享遠(yuǎn)程操作模擬數(shù)據(jù),加快研究在模擬環(huán)境中進(jìn)行決策策略學(xué)習(xí)。
手把手教你造 ALOHA 2,成本僅 19 萬(wàn)
最后,谷歌 DeepMind 還做了一份詳細(xì)的搭建指南,從零部件的準(zhǔn)備到具體的實(shí)施全流程覆蓋。
(以下是部分節(jié)選)
3D 打印的部分所需的零件:
搭建框架與重力補(bǔ)償系統(tǒng):
優(yōu)化原始的 ALOHA 框架,從而適應(yīng)重力補(bǔ)償系統(tǒng)和新的相機(jī)位置:
安裝移動(dòng)工作站:
安裝機(jī)器人:
將橫桿定位于桌子前端 305mm 處
安裝攝像頭:
你覺(jué)得全新升級(jí)的 ALOHA 2 怎么樣?
參考資料:
https://twitter.com/tonyzzhao/status/1755380475118719407
本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。