首頁(yè) > 智能時(shí)代>人工智能

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

量子位 2023/10/8 15:13:14 責(zé)編：遠(yuǎn)洋

評(píng)論：

傳奇程序員卡馬克（John Carmack），與強(qiáng)化學(xué)習(xí)之父薩頓（Richard Sutton）強(qiáng)強(qiáng)聯(lián)手了，All in AGI。

2030 年向公眾展示通用人工智能的目標(biāo)是可行的。

并且與主流方法不同，不依賴大模型范式，更追求實(shí)時(shí)的在線學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

兩人在薩頓任教的阿爾伯塔大學(xué)機(jī)器智能研究所（Amii）特別活動(dòng)上宣布了這一消息。

薩頓會(huì)加入卡馬克的 AI 創(chuàng)業(yè)公司 Keen Technologies，同時(shí)保持在阿爾伯塔的教職。

兩人在活動(dòng)中都承認(rèn)，與擁有成百上千員工的大公司相比，Keen Technologies 的團(tuán)隊(duì)規(guī)模很小。

目前還在剛起步階段，公司整個(gè)技術(shù)團(tuán)隊(duì)都到了現(xiàn)場(chǎng) —— 只有站著的這 4 個(gè)人。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

其融資規(guī)模 2000 萬(wàn)美元，與 OpenAI、Anthropic 這樣動(dòng)輒幾十億的也沒(méi)法比。

但他們相信，最終 AGI 的源代碼是一個(gè)人就能編寫(xiě)的量級(jí)，可能只有幾萬(wàn)行。

而且當(dāng)前 AI 領(lǐng)域正處在杠桿效應(yīng)最大的特殊時(shí)刻，小團(tuán)隊(duì)也有機(jī)會(huì)做出大貢獻(xiàn)。

傳奇程序員與強(qiáng)化學(xué)習(xí)之父

卡馬克的傳奇經(jīng)歷，從開(kāi)發(fā)世界第一款 3D 游戲，到轉(zhuǎn)型造火箭，再到加入 Oculus 成為后來(lái) Meta VR 關(guān)鍵人物的故事都已被人熟知。

后來(lái)他與 AI 結(jié)緣，還和 OpenAI 有關(guān)。

他曾在另一場(chǎng)訪談中透露，Sam Altman 曾邀他加入 OpenAI，認(rèn)為他能在系統(tǒng)優(yōu)化方面發(fā)揮重要作用。

但卡馬克當(dāng)時(shí)認(rèn)為自己對(duì)機(jī)器學(xué)習(xí)范式的現(xiàn)代 AI 沒(méi)有任何了解，也就沒(méi)有答應(yīng)。

這卻成了他開(kāi)始了解 AI 的一個(gè)契機(jī)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

他向 OpenAI 的首席科學(xué)家 Ilya Sutskever 要了一個(gè)入門(mén)必讀清單，從頭開(kāi)始自學(xué)，先對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法有了基本的了解。

等有了空閑，打算繼續(xù)涉足深度學(xué)習(xí)的時(shí)候，他來(lái)了個(gè)一周編程挑戰(zhàn)：

打印幾篇 LeCun 的經(jīng)典論文，在斷網(wǎng)情況下動(dòng)手實(shí)踐，從推反向傳播公式開(kāi)始。

一周過(guò)去后，他帶著用 C++ 手搓的卷積神經(jīng)網(wǎng)絡(luò)結(jié)束閉關(guān)，沒(méi)有借助 Python 上的現(xiàn)代深度學(xué)習(xí)框架。

只能說(shuō)佩服大神了。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

此時(shí)他的主業(yè)還是在 Facebook（后改名 Meta）旗下 Oculus 研究 VR，帶領(lǐng)團(tuán)隊(duì)推出了 Ouclus Go 和 Quest 等產(chǎn)品。

不過(guò)這個(gè)過(guò)程中，他與公司管理層之間也逐漸產(chǎn)生矛盾和分歧，認(rèn)為公司內(nèi)部效率低下，也曾公開(kāi)發(fā)表不滿。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

2019 年，他辭去 Oculus CTO 職位轉(zhuǎn)而擔(dān)任“顧問(wèn) CTO”，開(kāi)始把更多精力轉(zhuǎn)向 AI。

2022 年 8 月，他宣布新 AI 創(chuàng)業(yè)公司 Keen Technologies 宣布融資 2000 萬(wàn)美元，投資者包括紅杉資本，GitHub 前 CEO Nat Friedman 等。

后續(xù)他也透露，其實(shí)區(qū)區(qū) 2000 萬(wàn)美元，自己就拿得出手。

但是從別人那里拿錢(qián)能給他一種危機(jī)和緊迫感，有更強(qiáng)烈的決心把事情做好。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

2022 年底，他正式離開(kāi) Meta，并將 VR 視為已經(jīng)過(guò)去的一個(gè)人生階段，接下來(lái)完全轉(zhuǎn)向 AI。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

除了這條明面上的主線之外，卡馬克與 AI 還有一些莫名的緣分。

當(dāng)年他的 3D 游戲激發(fā)了對(duì)圖形計(jì)算的需求，GPU 也是從游戲領(lǐng)域開(kāi)始發(fā)展壯大。

到如今正是 GPU 的算力支持了 AI 的爆發(fā)，他談到這些時(shí)仍為自己的貢獻(xiàn)感到自豪。

……

今天的另一位主角薩頓也同樣是位傳奇人物。

他被譽(yù)為強(qiáng)化學(xué)習(xí)之父，為強(qiáng)化時(shí)間差異學(xué)習(xí)和策略梯度等方法做出重要貢獻(xiàn)，也是強(qiáng)化學(xué)習(xí)標(biāo)準(zhǔn)教科書(shū)的合著者。

2017 年他以杰出科學(xué)家身份加入 DeepMind，參與了 AlphaGo 系列研究，他的學(xué)生 David Silver 則是 AlphaGo 主要負(fù)責(zé)人之一。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

薩頓寫(xiě)過(guò)一篇著名短文 The Bitter Lesson，認(rèn)為試圖把人類經(jīng)驗(yàn)教給 AI 是行不通的，至今為止所有突破都是依靠算力提升，繼續(xù)利用算力的規(guī)模效應(yīng)才是正確道路。

兩人正式交流之前，卡馬克就曾表達(dá)過(guò)對(duì)這篇文章的關(guān)注和認(rèn)同。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

但兩人真正直接交流，是薩頓主動(dòng)聯(lián)系的。

幾個(gè)月前，卡馬克宣布 AGI 創(chuàng)業(yè)公司融資之后，收到了薩頓的郵件。

薩頓想要問(wèn)他他在研究的道路上應(yīng)該走純學(xué)術(shù)、商業(yè)化還是非盈利組織路線的問(wèn)題。

但在后續(xù)郵件交流中，兩人發(fā)現(xiàn)在 AI 研究方向和理念上存在驚人的一致性，漸漸確立了合作關(guān)系。

具體來(lái)說(shuō)，兩人達(dá)成了 4 個(gè)共識(shí)：

都認(rèn)為當(dāng)前 AGI 發(fā)展被限制在很窄的幾個(gè)方向上，過(guò)多依賴大數(shù)據(jù)和大算力而忽視了創(chuàng)新
都認(rèn)為太早商業(yè)化會(huì)阻礙 AGI 的發(fā)展
都認(rèn)為最終 AGI 不會(huì)太復(fù)雜，一個(gè)人就能掌握全部原理，甚至一個(gè)人就能寫(xiě)出主要的代碼。
都認(rèn)為 2030 年出現(xiàn) AGI 原型是一個(gè)可行的目標(biāo)。

不只依賴大模型，小團(tuán)隊(duì)也有機(jī)會(huì)

很大膽的目標(biāo)，現(xiàn)場(chǎng)觀眾也是這么認(rèn)為的。

面對(duì)“小團(tuán)隊(duì)如何搞定這么宏大的目標(biāo)”的提問(wèn)，卡馬克認(rèn)為實(shí)現(xiàn) AGI 所需的數(shù)據(jù)量和算力需求可能沒(méi)有想象中那么大。

把人類一整年眼中所見(jiàn)拍成每秒 30 幀的視頻，可以裝在拇指大小的 U 盤(pán)里。
而 1 歲兒童只擁有這么多經(jīng)驗(yàn)數(shù)據(jù)，已經(jīng)展現(xiàn)出明顯的智能。
如果算法對(duì)了，就不需要用整個(gè)互聯(lián)網(wǎng)的數(shù)據(jù)讓 AGI 去學(xué)習(xí)。

對(duì)于算力需求，他也是用這種直覺(jué)式的思維去考慮：人腦的計(jì)算能力也有限，遠(yuǎn)遠(yuǎn)達(dá)不到一個(gè)大型算力集群的程度。

比一個(gè)服務(wù)器節(jié)點(diǎn)（node）要大，也比一個(gè)機(jī)柜（rack）要大，但最大也就再高出一個(gè)數(shù)量級(jí)。

而且隨著時(shí)間推移，算法會(huì)更加高效，所需的算力還會(huì)持續(xù)下降。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

如果說(shuō)卡馬克在 3D 游戲、火箭和 VR，這些看似不搭邊的工作領(lǐng)域上有什么共同點(diǎn)，那就是對(duì)大型實(shí)時(shí)反饋系統(tǒng)的優(yōu)化。

這也是當(dāng)初 Sam Altman 邀請(qǐng)他加入 OpenAI 時(shí)看中的地方。

他設(shè)想中的 AGI 架構(gòu)應(yīng)該是模塊化和分布式的，而不是一個(gè)巨大的集中模型。

學(xué)習(xí)也應(yīng)該是持續(xù)的在線學(xué)習(xí)，而不是現(xiàn)在的預(yù)訓(xùn)練之后大部分參數(shù)就不再更新。

我的底線是，如果一個(gè)系統(tǒng)不能以 30hz 的頻率運(yùn)行，也就是訓(xùn)練時(shí) 33 毫秒左右更新一次，我就不會(huì)用它。

他進(jìn)一步表示，作為能自己寫(xiě)原始 Cuda 代碼和能自己管理網(wǎng)絡(luò)通信的底層系統(tǒng)程序員，可能會(huì)去做一些其他人根本不會(huì)考慮的工作。

甚至不僅局限于現(xiàn)有的深度學(xué)習(xí)框架，會(huì)嘗試更高效的網(wǎng)絡(luò)架構(gòu)和計(jì)算方法。

總體目標(biāo)是模擬一個(gè)具有內(nèi)在動(dòng)機(jī)和持續(xù)學(xué)習(xí)能力的虛擬智能體，在虛擬環(huán)境中持續(xù)學(xué)習(xí)。

不要機(jī)器人，因?yàn)橹圃旎鸺慕?jīng)歷讓他認(rèn)為打交道的物理對(duì)象越少越好。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

與卡馬克剛涉足 AGI 不久相比，薩頓在這個(gè)問(wèn)題上已經(jīng)花費(fèi)了幾十年，他有更具體的研究計(jì)劃。

雖然這次活動(dòng)上沒(méi)有說(shuō)太多，但主體部分已經(jīng)以“阿爾伯塔計(jì)劃”的形式寫(xiě)在一篇 arXiv 論文里。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

阿爾伯塔計(jì)劃提出了一個(gè)統(tǒng)一的智能體框架，強(qiáng)調(diào)普遍經(jīng)驗(yàn)而不是特殊的訓(xùn)練集，關(guān)注時(shí)間一致性，優(yōu)先考慮能隨算力產(chǎn)生規(guī)模效應(yīng)的方法，以及多智能體交互。

還提出了一個(gè)分為 12 步的路線圖。

前 6 步專注于設(shè)計(jì) model-free 的持續(xù)學(xué)習(xí)方法，后 6 步引入環(huán)境模型和規(guī)劃。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

其中最后一步稱為智能增強(qiáng) （Intelligence Amplification），一個(gè)智能體可以根據(jù)一些通用原則，利用它所學(xué)到的知識(shí)來(lái)放大和增強(qiáng)另一個(gè)智能體的行動(dòng)、感知和認(rèn)知。

薩頓認(rèn)為這種增強(qiáng)是充分發(fā)揮人工智能潛力的重要組成部分。

在這個(gè)過(guò)程中，確定評(píng)估 AI 進(jìn)步的指標(biāo)非常重要但也十分困難，團(tuán)隊(duì)正在探索不同的發(fā)展。

另外，卡馬克一直是開(kāi)源的倡導(dǎo)者，但在 AGI 的問(wèn)題上他表示會(huì)保持一定開(kāi)放性，但不會(huì)全部公開(kāi)算法細(xì)節(jié)。

作為一個(gè)小團(tuán)隊(duì)，卡馬克認(rèn)為需要保持開(kāi)拓精神，關(guān)注長(zhǎng)遠(yuǎn)發(fā)展而不是短期利益，

不會(huì)過(guò)早考慮商業(yè)化，沒(méi)有像 ChatGPT 這樣可以公開(kāi)發(fā)布的中間形態(tài)。

對(duì)于 2030 年能做到什么地步，卡馬克認(rèn)為“有可以向公眾展示的 AGI”，薩頓的表述是“AI 原型可以顯示出生命跡象（signs of life）”。

2030 成關(guān)鍵節(jié)點(diǎn)

2030 與 AGI，并不是第一次同時(shí)出現(xiàn)。

頂尖 AI 團(tuán)隊(duì)不約而同都把 2030 年前后作為實(shí)現(xiàn) AGI 的關(guān)鍵節(jié)點(diǎn)。

比如 OpenAI，在拿出 20% 總算力成立超級(jí)智能對(duì)齊部門(mén)的公告里寫(xiě)著，我們相信超級(jí)智能在這個(gè)十年段到來(lái)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

甚至投資界也出現(xiàn)類似的觀點(diǎn)，孫正義剛剛在軟銀世界企業(yè)大會(huì)上也拿出來(lái)這樣一張 PPT。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

除了 OpenAI 和 Keen Technologies，致力于開(kāi)發(fā) AGI 的組織并不多。

OpenAI 最大的競(jìng)爭(zhēng)對(duì)手，剛剛拿 40 億美元融資的 Anthropic，其 CEO Dario Amodei 在最近一次訪談中提到，兩三年內(nèi) AI 能表現(xiàn)得像一個(gè)受過(guò)良好教育的人類。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

Transformer 作者 Vaswani 與 Palmer 離開(kāi)谷歌時(shí)，創(chuàng)辦了 AdeptAI，目標(biāo)也是打造通用智能。

不過(guò)目前兩人今年初突然離開(kāi)這家公司，聯(lián)合創(chuàng)始人中只留下一位 David Luan（最右）。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

兩位 Transformer 作者另外創(chuàng)辦了一家 Essential AI，這家公司的愿景就沒(méi)那么“仰望星空”了，是比較務(wù)實(shí)的大模型商業(yè)化。

國(guó)內(nèi)方面明確喊出 AGI 目標(biāo)的同樣也不多，主要有 MiniMax 和楊植麟新創(chuàng)辦的月之暗面。

參考鏈接：

[1]https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/
[2]https://www.youtube.com/watch?v=uTMtGT1RjlY
[3]https://arxiv.org/abs/2208.11173

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

傳奇程序員與強(qiáng)化學(xué)習(xí)之父

不只依賴大模型，小團(tuán)隊(duì)也有機(jī)會(huì)

2030 成關(guān)鍵節(jié)點(diǎn)

相關(guān)文章

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

不只依賴大模型，小團(tuán)隊(duì)也有機(jī)會(huì)