設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
国资委:将对整车央企战略性重组    抖音首次公开推荐算法原理

機(jī)械手臂進(jìn)化之路:距離像人手一樣靈活不遠(yuǎn)了

2018/8/3 6:38:17 來源:網(wǎng)易科技 作者:李擎 責(zé)編:孤城

以前,機(jī)械手臂只能執(zhí)行由工程師團(tuán)隊(duì)編寫的程序,但是現(xiàn)在,它們可以自己學(xué)習(xí)更復(fù)雜的任務(wù)了。

雖然一只機(jī)械手臂和五個機(jī)械手指還不能達(dá)到與人類一樣的靈活度,但在世界頂級的人工智能實(shí)驗(yàn)室里,研究人員正越來越接近于創(chuàng)造出能夠模仿真實(shí)人手的機(jī)械手臂。

旋轉(zhuǎn)

在由埃隆·馬斯克和其他幾個硅谷知名人士共同創(chuàng)建的OpenAI實(shí)驗(yàn)室中,研究人員制造了一款名為Dactyl的機(jī)械手臂。它看起來很像最新的星球大戰(zhàn)電影中的盧克·天行者的機(jī)械假體:它的機(jī)械手指能夠像人的手指一樣彎曲或伸直。

你可以讓Dactyl為你展示字母積木的某一面——比方說紅色的O,橙色的P或藍(lán)色的I——它會向你展示,然后用靈活的方式旋轉(zhuǎn)、扭動和翻轉(zhuǎn)積木。

這對于人類來說非常簡單,但對于一臺機(jī)器來說,這是一個非常了不起的成就:機(jī)械手臂Dactyl在很大程度上是靠自己來學(xué)習(xí)如何完成這項(xiàng)任務(wù)的。研究人員利用數(shù)學(xué)的方法讓Dactyl學(xué)習(xí),他們相信可以通過訓(xùn)練讓機(jī)械手臂和其他機(jī)器來完成更復(fù)雜的任務(wù)。

這只靈巧的手臂代表了過去幾年機(jī)器人研究的巨大飛躍。但直到最近,研究人員仍在努力讓更簡單的機(jī)械手臂來掌握更簡單的任務(wù)。

抓取

這個系統(tǒng)是由加州大學(xué)伯克利分校的機(jī)器人實(shí)驗(yàn)室Autolab的研究人員創(chuàng)建的,它在幾年前代表了技術(shù)的極限。機(jī)器配有一個兩根手指的“鉗子”,可以拿起像螺絲起子或鉗子一樣的物件,然后把它們分類到不同容器里。

鉗子比五個手指更容易控制,而制造一個操作夾鉗所需的軟件也不那么困難。它可以處理一些不太熟悉的物體。比如,它可能不知道什么是餐館式的番茄醬瓶子,但是它知道瓶子的形狀和螺絲起子類似。但是,如果這臺機(jī)器遇到的東西與它之前所遇到的不同——比如一個塑料手鐲——可能就會處理的不太好。

拾取

大家都希望有一個能撿起任何東西的機(jī)器人,包括它以前從未見過的東西。這是其他Autolab的研究人員在過去幾年里所建立的機(jī)器人。

這個系統(tǒng)仍然使用簡單的硬件:一個夾子和一個吸盤。但它可以撿起各種各樣的隨機(jī)物品——從剪刀到塑料玩具恐龍。


該系統(tǒng)得益于機(jī)器學(xué)習(xí)的巨大進(jìn)步。伯克利的研究人員對超過1萬個物體的物理模型進(jìn)行了建模,確定了每一個物體的最佳選擇。然后,系統(tǒng)使用神經(jīng)網(wǎng)絡(luò)算法分析了所有這些數(shù)據(jù),并學(xué)會了識別每個物品的最佳方式。在過去,研究人員必須對機(jī)器人進(jìn)行編程,讓它們完成每項(xiàng)任務(wù)。但現(xiàn)在,它可以自己學(xué)習(xí)這些任務(wù)。

當(dāng)面對一個塑料尤達(dá)玩具時,系統(tǒng)會意識到它應(yīng)該用鉗子把玩具撿起來。但當(dāng)它遇到番茄醬瓶子時,它會選擇吸杯。這個機(jī)械手可以成功地?fù)炱鸲嗉S機(jī)物品。

它并不完美,但是由于系統(tǒng)可以自己學(xué)習(xí),它的進(jìn)步速度比過去的機(jī)器快得多。

圖:機(jī)械手撿拾物品(2倍速播放)

鋪床

伯克利的研究人員利用最新的機(jī)器學(xué)習(xí)技術(shù),在短短兩周的時間內(nèi)就整合完成了可以鋪床的機(jī)器人系統(tǒng)。這個機(jī)器人也許還不能完美地完成醫(yī)院的工作,但它已經(jīng)代表了顯著的進(jìn)步。

圖:機(jī)器人模擬鋪床(2倍速播放)

現(xiàn)在,只要通過分析數(shù)據(jù),這個系統(tǒng)就可以在一小段時間內(nèi)學(xué)會鋪床。在學(xué)習(xí)時,系統(tǒng)會分析鋪床過程中的每一個動作。

圖:機(jī)器人模擬鋪床(2倍速播放)

移動

在伯克利的BAIR實(shí)驗(yàn)室里,另一個系統(tǒng)正在應(yīng)用其它的學(xué)習(xí)方法。這個機(jī)械手臂可以用一個夾子推動物體,并預(yù)測它應(yīng)該在的位置。這意味著它可以像你我一樣把玩具移到桌子上。

這個系統(tǒng)通過分析大量的視頻圖像來學(xué)習(xí)這種行為,這些圖像顯示了物體是如何被移動的。通過這種方式,它可以處理這種任務(wù)帶來的不確定性以及一些意想不到的動作。

未來

這些都是簡單的任務(wù),而且機(jī)器只能在特定條件下處理它們。它們失敗的次數(shù)并不比成功的次數(shù)少。但驅(qū)動這些系統(tǒng)的機(jī)器學(xué)習(xí)方法表明,在未來幾年內(nèi)將會繼續(xù)取得很大的進(jìn)步。

和OpenAI的研究人員一樣,華盛頓大學(xué)的研究人員正在訓(xùn)練機(jī)器手臂,這些機(jī)械手臂擁有與人類相同的手指和關(guān)節(jié)。

這比訓(xùn)練一個夾鉗或吸盤要困難得多,一個模擬人類的手應(yīng)該能夠以多種不同的方式移動。因此,華盛頓的研究人員通過模擬周圍的環(huán)境來訓(xùn)練他們的機(jī)器手臂。

在OpenAI,研究人員正在以同樣的方式訓(xùn)練他們的Dactyl機(jī)械手,這個系統(tǒng)旋轉(zhuǎn)字母積木的過程積累了大約100年的訓(xùn)練經(jīng)驗(yàn)。這一數(shù)字模擬在成千上萬的計(jì)算機(jī)芯片上同時運(yùn)行,得以將訓(xùn)練時間壓縮到兩天。它通過反復(fù)的嘗試和犯錯來學(xué)習(xí)這些任務(wù)。一旦它了解了模擬時的工作原理,它就可以將這些知識應(yīng)用到現(xiàn)實(shí)世界中。

許多研究人員質(zhì)疑這種模擬訓(xùn)練是否使成果只停留在理論層面,但就像伯克利和其他實(shí)驗(yàn)室的研究人員一樣,OpenAI團(tuán)隊(duì)已經(jīng)證明了這一點(diǎn)。他們在模擬訓(xùn)練中引入了一定的隨機(jī)性——它們改變了手和木塊之間的摩擦力,甚至改變了模擬的重力。在模擬的世界中,學(xué)會處理這種隨機(jī)性后,機(jī)械手就可以處理真實(shí)世界的不確定性。

今天,Dactyl所能做的只是旋轉(zhuǎn)一個方塊,但研究人員正在探索如何將這些技術(shù)應(yīng)用于更復(fù)雜的任務(wù)。比如制造業(yè),無人駕駛飛機(jī),甚至是無人駕駛汽車。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:機(jī)器人機(jī)械手
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知