設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

首個(gè)機(jī)器人 4D 世界模型來了:智元機(jī)器人團(tuán)隊(duì)提出 EnerVerse 架構(gòu)

2025/1/8 10:07:43 來源:IT之家 作者:歸瀧(實(shí)習(xí)) 責(zé)編:歸瀧
感謝IT之家網(wǎng)友 Skyraver 的線索投遞!

IT之家 1 月 8 日消息,如何讓機(jī)器人在任務(wù)指引和實(shí)時(shí)觀測(cè)的基礎(chǔ)上規(guī)劃未來動(dòng)作是具身智能領(lǐng)域核心問題,其受“模態(tài)對(duì)齊”和“數(shù)據(jù)稀缺”制約。智元機(jī)器人團(tuán)隊(duì)提出 EnerVerse 架構(gòu),通過自回歸擴(kuò)散模型(autoregressive diffusion),在生成未來具身空間的同時(shí)引導(dǎo)機(jī)器人完成復(fù)雜任務(wù)。

據(jù)介紹,不同于現(xiàn)有方法簡(jiǎn)單應(yīng)用視頻生成模型,EnerVerse 深度結(jié)合具身任務(wù)需求,創(chuàng)新性地引入稀疏記憶機(jī)制(Sparse Memory)與自由錨定視角(Free Anchor View, FAV),在提升 4D 生成能力的同時(shí),實(shí)現(xiàn)了動(dòng)作規(guī)劃性能的突破。

智元機(jī)器人官方稱,實(shí)驗(yàn)結(jié)果表明 EnerVerse 不僅具備未來空間生成能力,更在機(jī)器人動(dòng)作規(guī)劃任務(wù)中實(shí)現(xiàn)了當(dāng)前最優(yōu)(SOTA)表現(xiàn)。IT之家從智元官方獲悉,目前項(xiàng)目主頁論文《EnerVerse:設(shè)想機(jī)器人操作的具身未來空間》已上線,模型與相關(guān)數(shù)據(jù)集即將開源。

圖片

EnerVerse 主要科研成員來自智元機(jī)器人研究院具身算法團(tuán)隊(duì)。論文共同一作黃思淵是上海交通大學(xué)與上海人工智能實(shí)驗(yàn)室的聯(lián)培博士生,師從 CUHK-MMLab 的李鴻升教授。博士期間的研究課題為基于多模態(tài)大模型的具身智能以及高效智能體的研究。在 CoRL、MM、 IROS、ECCV 等頂級(jí)會(huì)議上,以第一作者或共同第一作者身份發(fā)表多篇論文。另一位共同一作陳立梁是智元機(jī)器人的具身算法專家,主要負(fù)責(zé)具身空間智能與世界模型的研究。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知