IT之家 12 月 30 日消息,智元機器人今天宣布推出全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數(shù)據集開源項目 AgiBot World。
智元機器人表示:“這一里程碑式的開源項目,標志著具身智能領域‘ImageNet 時刻’已到來。”
智元機器人將按計劃在 HuggingFace、Github 以及 agibot-world.com 項目主頁上分批上傳數(shù)據,IT之家附地址如下:
HuggingFace:
https://huggingface.co/agibot-world
Github:
https://github.com/OpenDriveLab/agibot-world
項目主頁:
智元機器人介紹稱,AgiBot World 是全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數(shù)據集。相比谷歌開源的 Open X-Embodiment 數(shù)據集,AgiBot World 長程數(shù)據規(guī)模高出 10 倍,場景范圍覆蓋面擴大 100 倍,數(shù)據質量從實驗室級上升到工業(yè)級標準。
未來,智元機器人將陸續(xù)開源千萬仿真數(shù)據,以支持更泛化和更通用的大模型訓練;將發(fā)布具身基座大模型,可支持模型微調;發(fā)布全套工具鏈,實現(xiàn)采集、訓練和評測閉環(huán)。
IT之家附官方介紹如下:
01、多樣任務,十八般武藝樣樣精通
AgiBot World 數(shù)據集中涵蓋的場景具備多樣化和多元化特點,從抓取、放置、推、拉等基礎操作,到攪拌、折疊、熨燙等復雜動作,幾乎涵蓋了人類日常生活所需的絕大多數(shù)場景。比如,其中一個視頻展示的是機器人在電腦主機中內存條的過程,這需要機器人毫米級精細控制,稍有不慎就可能導致設備損壞,其如神經纖維般靈敏的末端觸覺傳感器,助力機器人實現(xiàn)了精準的對接;還有試圖教會機器人如何用洗碗機的視頻 —— 在這條數(shù)據中,展現(xiàn)了廚房水池里勺筷碗盤層層堆疊,機器人將雜亂的餐具一一準確無誤地整理至洗碗機相應卡槽中,操作流程長且動作十分繁瑣。AgiBot World 數(shù)據集中收錄了 80 多種日常生活中的多樣化技能視頻,讓機器人能夠“十八般武藝樣樣精通”。
02、全域場景,上得廳堂下得廚房
AgiBot World 數(shù)據集誕生于智元自建的大規(guī)模數(shù)據采集工廠與應用實驗基地,空間總面積超過 4000 平方米,包含 3000 多種真實物品,一方面為機器人大規(guī)模數(shù)據訓練提供場地,另一方面真實復刻了家居、餐飲、工業(yè)、商超和辦公五大核心場景,全面覆蓋了機器人在生產、生活中的典型應用需求。
家居場景再現(xiàn)人類真實住宅布局,包括臥室、客廳、廚房、衛(wèi)生間等核心空間,可以實現(xiàn)機器人家務清潔、物品整理和廚房任務等。工業(yè)場景模擬分揀與物流自動化,復刻工業(yè)倉庫與生產線,包括分揀系統(tǒng)、打包設備、傳輸帶等,可以實現(xiàn)物料分揀、包裝打包、物流搬運等。通過多場景的高度還原與任務設計,AgiBot World 為機器人研發(fā)和測試構建了實現(xiàn)具身智能的必要條件。
像這樣類似的真實場景 AgiBot World 百萬真機數(shù)據集中有 100 多種,家居占 40%、餐飲 20%、工業(yè) 20%、商超 10% 以及辦公場景 10%,其中 80% 的任務均為長程任務,任務時長集中在 60s-150s 之間,并且包含多個原子技能,長程數(shù)據是 DROID 和 OpenX-Embodiment 的 10 倍以上,3000 多種物品基本涵蓋了這五大場景,同時還在不斷豐富中。
場景和任務分布
各個場景物品分類
數(shù)據集時長分布 03、全能硬件,沒有金剛鉆難攬瓷器活
機器人能夠如此靈活智能、勝任多種任務和技能,也得益于智元對于機器人本體的迭代升級 —— 我們?yōu)闄C器人安裝了 8 個環(huán)繞式布局的攝像頭,讓機器人可以實時 360 度全方位感知周圍環(huán)境的動態(tài)變化;配備 6 自由度靈巧手,保障動作精準且靈活,同時末端還增加了六維力傳感器和高精度觸覺傳感器,能夠感知力的微小變化,做到“拿捏有度”;機器人全身擁有 32 個主動自由度,能夠靈活應對多種復雜任務。
04、質量把控,嚴師出高徒
同時,數(shù)據集的質量,也是決定機器人能否快速學習的關鍵。AgiBot World 中的數(shù)據,都需歷經一套嚴苛的流程與驗證鏈路。在項目之初,我們便邀請學界、工業(yè)界、消費者等多方介入提出建議,不斷迭代流程設計規(guī)劃;數(shù)據采集質量環(huán)節(jié),無論是采集員還是采集質量,均由完善的管理體系和專業(yè)的管理團隊全程保障;對于采集到的數(shù)據本身,將通過端、云兩側嚴格篩選,自動剔除不符合要求的數(shù)據,再由專業(yè)的審核員逐幀審核,確保每一個動作都符合任務標準;最后,這些數(shù)據還會通過算法進行二次驗證,全方位筑牢數(shù)據質量防線。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。