首頁(yè) > 科學(xué)探索>科技前沿

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

量子位 2023/7/8 20:44:08 責(zé)編：夢(mèng)澤

評(píng)論：

OpenAI 一次性拿出 20% 總算力，投入全新研究方向 ——

超級(jí)智能對(duì)齊（Superalignment）。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

先說(shuō)說(shuō) OpenAI 的 20% 總算力什么概念？

光是微軟此前專門(mén)給他們打造的一臺(tái)超級(jí)計(jì)算機(jī)，就有 285000 塊 CPU 和上萬(wàn)塊英偉達(dá) A100 GPU。

外界沒(méi)人知道 OpenAI 現(xiàn)在擁有多少 H100 GPU，只知道他們總?cè)谫Y 113 億美元，還要算上微軟額外提供的 Azure 云算力。

這番大手筆，仿佛直接在科技圈扔下一個(gè)炸彈。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

再看這份公告中的微妙用詞區(qū)別：

不是通用人工智能（AGI），甚至干脆去掉了人工二字。

直接越級(jí)瞄準(zhǔn)如何控制超級(jí)智能，其定義為比人類聰明得多的 AI 系統(tǒng)（much smarter than us）。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

正文則明晃晃地寫(xiě)著：雖然看起來(lái)還很遙遠(yuǎn)，但我們相信超級(jí)智能將在這個(gè)十年段到來(lái)。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

現(xiàn)在是 2023 年下半年，總共留給人類的時(shí)間還有 6 年半。

OpenAI 給自己定的時(shí)限更短，只有 4 年。

控制“奧創(chuàng)”需要“賈維斯”

有網(wǎng)友將 OpenAI 公布的研究方法形容為“賈維斯 vs 奧創(chuàng)”。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

OpenAI 明白靠人類自己已無(wú)法完成，提出新概念自動(dòng)對(duì)齊研究員（automated alignment researcher）

也就是先訓(xùn)練一個(gè)大致達(dá)到人類水平的 AI 研究員，再投入大量算力快速迭代。

翻譯一下：先努力達(dá)到技術(shù)奇點(diǎn)，然后直接開(kāi)啟大爆炸。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

整個(gè)計(jì)劃的基石，就是先打造第一個(gè)自動(dòng)對(duì)齊研究員。

為此 OpenAI 提出一個(gè)臨時(shí)解決方案，分為三項(xiàng)：

開(kāi)發(fā)一個(gè)可擴(kuò)展的訓(xùn)練方法

為了在人類難以評(píng)估的任務(wù)上提供訓(xùn)練信號(hào)，需要利用 AI 來(lái)協(xié)助評(píng)估其他 AI 系統(tǒng)，稱為“可擴(kuò)展的監(jiān)督”。

驗(yàn)證第一步產(chǎn)生的模型

為了驗(yàn)證系統(tǒng)的一致性，自動(dòng)搜索有問(wèn)題的行為和有問(wèn)題的內(nèi)部結(jié)構(gòu)。

對(duì)整個(gè)管道流程做壓力測(cè)試

通過(guò)故意訓(xùn)練不對(duì)齊的模型來(lái)測(cè)試整個(gè)管道，并確認(rèn)技術(shù)可以檢測(cè)到最糟糕的錯(cuò)誤類型，也就是對(duì)抗性測(cè)試。

為什么說(shuō)是臨時(shí)解決方案？

OpenAI 預(yù)計(jì)隨著對(duì)問(wèn)題進(jìn)一步了解，研究重點(diǎn)將發(fā)生實(shí)質(zhì)性變化，很可能增加全新的研究領(lǐng)域。

再翻譯一下：只能走一步看一步。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

首席科學(xué)家?guī)ш?duì)，成立全新部門(mén)

研究頂級(jí)的問(wèn)題需要頂級(jí)的團(tuán)隊(duì)。

OpenAI 聯(lián)創(chuàng)和首席科學(xué)家 Ilya Sutskever 將與此前的對(duì)齊團(tuán)隊(duì)負(fù)責(zé)人 Jan Leike 共同領(lǐng)導(dǎo)新部門(mén)。

而成員不光包括 OpenAI 自己的員工，也包括來(lái)自其它公司的研究人員。

Ilya Sutskever 是 2012 年開(kāi)啟深度學(xué)習(xí)時(shí)代的 AlexNet 作者之一，也是 AlphaGo 作者之一，此前已將 AI 對(duì)齊作為他的核心研究重點(diǎn)，總引用數(shù)超過(guò) 40 萬(wàn)。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

Jan Leike 則是 ChatGPT 的前身 InstructGPT 論文作者之一，并且早在 2017 年就參與了 OpenAI 與 DeepMind 合作的人類反饋強(qiáng)化學(xué)習(xí)方法。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

Jan Leike 認(rèn)為，OpenAI 此次投資很可能比全人類此前對(duì) AI 對(duì)齊研究的所有投資加起來(lái)還多。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

算上這二位，目前新團(tuán)隊(duì)已有 10 位成員。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

新一輪招聘也隨之開(kāi)啟，分為研究經(jīng)理（年薪 42 萬(wàn)-50 萬(wàn)美元），研究科學(xué)家與研究工程師（年薪 24.5 萬(wàn)-45 萬(wàn)美元），兩種級(jí)別三個(gè)崗位。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

誰(shuí)來(lái)監(jiān)管監(jiān)管者？

對(duì)于 OpenAI 的大動(dòng)作，學(xué)術(shù)界有不同觀點(diǎn)。

認(rèn)同的學(xué)者表示：自然智能通過(guò)競(jìng)爭(zhēng)的進(jìn)化獎(jiǎng)勵(lì)產(chǎn)生，AI 通過(guò)對(duì)齊人類利益的進(jìn)化獎(jiǎng)勵(lì)產(chǎn)生，并期待未來(lái)的效果。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

但也有人表示 OpenAI 從根本上就錯(cuò)誤地理解了“對(duì)齊”這個(gè)概念。

他認(rèn)為對(duì)齊不能是強(qiáng)制控制，而應(yīng)該是使雙方利益一致，類似于“堵不如疏”。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

有網(wǎng)友吐槽“真不敢相信，AGI 很可能在鴿了很久的《上古卷軸 6》游戲之前到來(lái)?！?/p>

評(píng)論區(qū)有人指出，到時(shí)候你想玩什么游戲讓 AI 去做就好了。

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

也有網(wǎng)友靈魂發(fā)問(wèn)，誰(shuí)又來(lái)監(jiān)管監(jiān)管者呢？

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

參考鏈接：

[1]https://openai.com/blog/introducing-superalignment
[2]https://twitter.com/OpenAI/status/1676638358087553024
[3]https://www.reddit.com/r/singularity/comments/14rh1l1/superintelligence_possible_in_the_next_7_years/

本文來(lái)自微信公眾號(hào)：量子位（ID：QbitAI），作者：夢(mèng)晨

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

控制“奧創(chuàng)”需要“賈維斯”

首席科學(xué)家?guī)ш?duì)，成立全新部門(mén)

誰(shuí)來(lái)監(jiān)管監(jiān)管者？

相關(guān)文章

OpenAI 開(kāi) 300 萬(wàn) + 年薪招「超級(jí) AI 研究員」，投入 20% 總算力成立新部門(mén)，目標(biāo) 4 年內(nèi)「控制奧創(chuàng)」

首席科學(xué)家?guī)ш?duì)，成立全新部門(mén)

誰(shuí)來(lái)監(jiān)管監(jiān)管者？