設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
漫威《复仇者联盟 5》开拍,27 名演员公布    2025 胡润全球富豪榜发布

提升機(jī)器人 3D 操作能力,北京大學(xué)與智元機(jī)器人聯(lián)合實(shí)驗(yàn)室發(fā)布 OmniManip

2025/1/23 13:19:07 來源:IT之家 作者:歸瀧(實(shí)習(xí)) 責(zé)編:歸瀧

IT之家 1 月 23 日消息,如何將視覺語?基礎(chǔ)模型(Vision  Language  Models,  VLMs)應(yīng)?于機(jī)器?以實(shí)現(xiàn)通?操作是具身智能領(lǐng)域的?個(gè)核?問題,這??標(biāo)的實(shí)現(xiàn)受兩?關(guān)鍵挑戰(zhàn)制約:

  • VLM 缺少精確的 3D 理解能?:通過對(duì)?學(xué)習(xí)范式訓(xùn)練、僅以 2D 圖像 / ?本作為輸?的 VLM 的天然局限;

  • ?法輸出低層次動(dòng)作:將 VLM 在機(jī)器?數(shù)據(jù)上進(jìn)?微調(diào)以得到視覺 - 語? - 動(dòng)作(VLA)模型是?種有前景的解決?案,但?前仍受到數(shù)據(jù)收集成本和泛化能?的限制。

上海智元新創(chuàng)技術(shù)有限公司官方今日發(fā)文稱,北?攜?智元機(jī)器?團(tuán)隊(duì)提出 OmniManip 架構(gòu),基于以對(duì)象為中?的 3D 交互基元,將 VLM 的高層次推理能力轉(zhuǎn)化為機(jī)器?的低層次高精度動(dòng)作。

針對(duì)?模型幻覺問題和真實(shí)環(huán)境操作的不確定性,OmniManip 引?了 VLM 規(guī)劃和機(jī)器?執(zhí)?的雙閉環(huán)系統(tǒng)設(shè)計(jì),實(shí)現(xiàn)了操作性能突破。目前項(xiàng)?主?論?已上線,代碼與測試平臺(tái)即將開源

圖片

IT之家從智元機(jī)器人官方獲悉,OmniManip 的關(guān)鍵設(shè)計(jì)包括:

  • 基于 VLM 的任務(wù)解析:利? VLM 強(qiáng)?的常識(shí)推理能?,將任務(wù)分解為多個(gè)結(jié)構(gòu)化階段(Stages),每個(gè)階段明確指定了主動(dòng)物體(Active)、被動(dòng)物體(Passive)和動(dòng)作類型(Action)。

  • 以物體為中?的交互基元作為空間約束:通過 3D 基座模型?成任務(wù)相關(guān)物體的 3D 模型和規(guī)范化空間(canonical space),使 VLM 能夠直接在該空間中采樣 3D 交互基元,作為 Action 的空間約束,從?優(yōu)化求解出 Active 物體在 Passive 物體規(guī)范坐標(biāo)系下的?標(biāo)交互姿態(tài)。

  • 閉環(huán) VLM 規(guī)劃:將?標(biāo)交互姿態(tài)下的 Active / Passive 物體渲染成圖像,由 VLM 評(píng)估與重采樣,實(shí)現(xiàn) VLM 對(duì)?身規(guī)劃結(jié)果的閉環(huán)調(diào)整。

  • 閉環(huán)機(jī)器?執(zhí)?:通過物體 6D 姿態(tài)跟蹤器實(shí)時(shí)更新 Active / Passive 物體的位姿,轉(zhuǎn)換為機(jī)械臂末端執(zhí)?器的操作軌跡,實(shí)現(xiàn)閉環(huán)執(zhí)?。

此外,OmniManip 具備通?泛化能?,不受特定場景和物體限制。團(tuán)隊(duì)已將其應(yīng)?于數(shù)字資產(chǎn)?動(dòng)標(biāo)注 / 合成管道,實(shí)現(xiàn)?規(guī)模的機(jī)器?軌跡?動(dòng)采集。該研究團(tuán)隊(duì)將開源泛化操作?規(guī)模數(shù)據(jù)集和對(duì)應(yīng)的仿真評(píng)測基準(zhǔn)。

據(jù)IT之家此前報(bào)道,以“天才少年”身份加入華為的稚暉君于 2022 年底宣布離職,創(chuàng)業(yè)智元機(jī)器人。2024 年 9 月 3 日,智元機(jī)器人完成 A++++++ 輪融資,估值已超過 70 億元,得到了包括北汽、上汽、比亞迪在內(nèi)的國內(nèi)汽車巨頭支持。

目前,智元機(jī)器人量產(chǎn)的第 1000 臺(tái)通用具身機(jī)器人已于本月(1 月 6 日)正式下線,其中包括 731 臺(tái)雙足人形機(jī)器人(遠(yuǎn)征 A2 / 靈犀 X1)和 269 臺(tái)輪式通用機(jī)器人(遠(yuǎn)征 A2-D / A2-W)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智元機(jī)器人,3D 操作OmniManip
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知