首頁 > 科學探索>科技前沿

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

量子位 2023/3/28 13:07:10 責編：夢澤

評論：

“AI 確實可能殺死人類?！?/p>

這話并非危言聳聽，而是 OpenAI CEO 奧特曼的最新觀點。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

而這番觀點，是奧特曼在與 MIT 研究科學家 Lex Fridman 長達 2 小時的對話中透露。

不僅如此，奧特曼談及了近期圍繞 ChatGPT 產(chǎn)生的諸多問題，坦承就連 OpenAI 團隊，也根本沒搞懂它是如何“進化”的：

從 ChatGPT 開始，AI 出現(xiàn)了推理能力。但沒人能解讀這種能力出現(xiàn)的原因。

唯一的途徑是向 ChatGPT 提問，從它的回答中摸索它的思路。

針對馬斯克在推特上的“危險論”，他直言：

馬斯克在我心中是英雄，我支持也理解他的擔憂。
雖然他在推特上挺混蛋的，但希望馬斯克能看到我們在解決 AGI 安全問題上付出了多大的努力。

除此之外，在這場對話過程中，奧特曼還提到了不少刁鉆的話題，例如：

ChatGPT、GPT-4 開發(fā)的內幕
GPT-4 是人類迄今所實現(xiàn)的最復雜的軟件
如何看待大家拿 ChatGPT 越獄
……

在看過這場對話之后，網(wǎng)友直呼：

兩位 AI 大佬用大家都能理解的方式聊 AI，多來點這樣的訪談。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

那么接下來，我們就來一同看下他們這場深度對話。

GPT-4 內幕大曝光

GPT-4 是這場對話中最受關注的部分。

它是如何訓練的？如何在訓練模型時避免浪費算力？如何解決 AI 回答不同價值觀的人的問題？

首先是訓練過程，依舊是預訓練 + RLHF，不過透露了一點具體細節(jié)。

GPT-4 早在去年夏天就已經(jīng)訓練完成，后面一直在進行對齊工作，讓它表現(xiàn)得更符合人類需求。

相比預訓練數(shù)據(jù)集，RLHF 所用的數(shù)據(jù)非常少，但效果是決定性的。

對此，奧特曼透露了一點數(shù)據(jù)來源，包含一些開源數(shù)據(jù)集、以及合作商提供的部分數(shù)據(jù)集。

當然，數(shù)據(jù)集中也有一點 Reddit 論壇上出現(xiàn)的迷因梗（meme），但不是很多。對此奧特曼遺憾表示：

如果再多點，它的回答可能會更有趣。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

即便如此，團隊甚至奧特曼自己依舊不能完全解讀 GPT-4。

目前對它的解讀方式，依舊是通過不斷問它問題，通過它的回答來判斷它的“思路”。

而就在不斷測試中，OpenAI 發(fā)現(xiàn)從 ChatGPT 開始，GPT 系列出現(xiàn)了推理能力。

雖然 ChatGPT 絕大部分時候都被當做數(shù)據(jù)庫使用，但它確實也出現(xiàn)了一定的推理能力，至于這種能力具體如何出現(xiàn)的，目前卻無人能回答。

但大模型的訓練往往意味著大量算力需求。對此奧特曼再次提到了 OpenAI 獨特的訓練預測方法：

即便模型很大，團隊目前也有辦法只通過部分訓練，預測整個模型的性能，就像是預測一名 1 歲的嬰兒能否通過 SAT 考試一樣。

關于這一點，在 GPT-4 論文和官方博客中也有更詳細介紹。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

最后奧特曼承認，GPT-4 確實存在應對不同價值觀的人的問題。

臨時解決辦法就是把更改系統(tǒng)消息（system message）的權限開放給用戶，也就是 ChatGPT 中經(jīng)常見到的那段“我只是一個語言模型……”。

通過改變系統(tǒng)消息，GPT-4 會更容易扮演其中規(guī)定的角色，比在對話中提出要求的重視程度更高，如規(guī)定 GPT-4 像蘇格拉底一樣說話，或者只用 JSON 格式回答問題。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

所以，對于 GPT 系列來說，誰最可能載入人工智能史冊？奧特曼倒不認為是 GPT-4：

從可用性和 RLHF 來看，ChatGPT 無疑是最具里程碑的那一個，背后的模型沒有產(chǎn)品的實用性重要。

最會打太極的 CEO

GPT-4 論文中沒有透露參數(shù)規(guī)模、訓練數(shù)據(jù)集大小等更多細節(jié)，還被外界吐槽越來越不 Open 了。

在這次訪談中，面對主持人步步追問，奧特曼依舊守口如瓶。

GPT-4 預訓練數(shù)據(jù)集有多大？奧特曼只是很籠統(tǒng)的介紹了有公開數(shù)據(jù)集、有來自合作伙伴的內容（如 GitHub 提供的代碼）還有來自網(wǎng)絡的內容。

活像 ChatGPT 也能寫出來的那種賽博八股文，只有在談到 Reddit 的時候透露了網(wǎng)絡梗圖在訓練數(shù)據(jù)中占比不大，“不然 ChatGPT 可能更有趣一些”。

GPT-4 模型參數(shù)量有多大？奧特曼只是說之前瘋傳的 100 萬億參數(shù)是謠言，然后又糊弄過去了。

我認為人們被參數(shù)競賽所吸引，就像過去被 CPU 的主頻競賽所吸引一樣?，F(xiàn)在人們不再關心手機處理器有多少赫茲了，關心的是這東西能為你做什么。

不過奧特曼對于一種說法是持有肯定態(tài)度 ——“GPT-4 是人類迄今所實現(xiàn)的最復雜的軟件”。

但在主持人 Lex 突然拋出一些時下針對 GPT-4 的尖銳觀點時，奧特曼的應對也堪稱“AI 般淡定”（狗頭）。

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

例如，關于前段時間鬧得沸沸揚揚的 GPT-4 越獄問題。

一名斯坦福教授僅僅用 30 分鐘，就誘導 GPT-4 制定出了越獄計劃，并全部展示了出來。

對此奧特曼表示，就如同當年 iPhone 也面臨被“黑”或者說越獄的問題（如當年免費的越獄版 App Store）一樣，這并非不能解決的事情。

奧特曼甚至坦承，他當年就把自己的第一臺蘋果手機越獄了 —— 甚至當時覺得這是個很酷的事情。

但現(xiàn)在已經(jīng)沒有多少人去干蘋果越獄的事情了，因為不越獄也足夠好用了。

奧特曼表示，OpenAI 的應對思路同樣如此，即把功能做的足夠強，他甚至表示，愿意在這方面給用戶開更多權限，以便了解他們到底想要什么。

除此之外，Lex 還提到了馬斯克對于奧特曼的批評。

奧特曼雖然是當年被馬斯克一手提拔的人才，但如今馬斯克不僅退出了他們聯(lián)手創(chuàng)辦的 OpenAI，還對 OpenAI 現(xiàn)狀十分不滿，經(jīng)常在推特上陰陽怪氣這家公司。

我捐 1 億美金成立的非營利組織怎么就變成一個 300 億市值的營利性公司了呢？如果這是合法的，為什么其他人不這樣做？

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

作為 OpenAI 現(xiàn)任 CEO，奧特曼并未直接回應此事，而是調侃了一下馬斯克在航天領域也經(jīng)常被“老前輩”們批評的事情。

這一系列采訪問答，不禁讓人想到在 ChatGPT 發(fā)布后，奧特曼對于記者“將 ChatGPT 整合進微軟必應和 Office”問題的回應方式：

你知道我不能對此發(fā)表評論。我知道你知道我不能對此發(fā)表評論。你知道我知道你知道我不能對此發(fā)表評論。
既然如此，為什么你還要問它呢？

GPT 的“偏見”不會消失

GPT 在迭代過程中“偏見”必然存在，它不可能保持完全中立。

在主持人提到關于 ChatGPT 以及 GPT-4 種存在的偏見問題時，奧特曼這樣回應道。

ChatGPT 在推出之初，就不是一個成熟的產(chǎn)品，它需要不斷迭代，而在迭代的過程中，僅僅依靠內部的力量是無法完成的。

“提前”推出 ChatGPT 技術，是要借助外部世界的集體智慧和能力，同時也能讓全世界參與進“塑造 AI”的過程中。

而不同人對于問題的看法也各不相同，所以在這個過程中，“偏見”問題就不可避免。

甚至奧特曼在話里話外也透露著：在 GPT 中，“偏見”永遠不會消失。

他將外部參與建設 GPT 比作“公開領域建設的權衡”。

GPT 生成答案是個性化控制的結果，迭代的過程則是更精準地控制“個性化”的過程。

有趣的是，期間奧特曼還暗戳戳“背刺”起了馬斯克的推特：

推特摧毀掉的多元性，我們正在將其找回來。

（嗯，奧特曼是懂一些話術的）

當然，談到 ChatGPT，總繞不開其背后的公司 OpenAI，在成立之初，它就立下了兩個 Flag：

1、非營利性
2、通用人工智能（AGI）

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

如今，已經(jīng)過去八年之久，這兩個 Flag 也是發(fā)生了巨大的變化：AGI 的大旗還在高舉，而非營利性這面旗則已經(jīng)搖搖欲墜。

對此，奧特曼也是分別作出了回應。

對于 OpenAI“非營利性質”的逐漸削弱，奧特曼直言：很久之前，就已經(jīng)意識到非營利性不是長久之計。

僅僅依靠非營利籌集到的資金對 OpenAI 的研究來說遠遠不夠，商業(yè)化是必然選擇。

但在之后奧特曼也試圖“找補”回一些，稱目前的商業(yè)化的程度僅止于滿足投資者與員工的固定回報，剩余資金還是會流向非營利性組織。

提到 AGI，一開始在 OpenAI 聲稱要做通用人工智能時，還有一堆人在嘲諷，如今做出 GPT-4 這樣的產(chǎn)品，回過頭來再看，嘲諷的聲音已經(jīng)越來越少了。

而面對外界詢問“GPT-4 是 AGI 嗎”這樣的問題時，奧特曼則是直接給出了自己理解中的 AGI：

AGI 所掌握的知識應該是要超過人類科學知識總和的，并且具有創(chuàng)造性，能夠推動基礎科學的發(fā)展；
而目前所有 GPT 并不能做到這些，想要達到 AGI 還需要在目前 GPT 的范式上進行拓展，至于如何拓展，正是目前所缺乏的。

值得一提的是，談到 AGI 時，是奧特曼在訪談中鮮有的“兩眼放光”的時刻。

他拋出了一句極具“科研分子理想情懷”的金句：

也許 AGI 是永遠抵達不了的烏托邦，但這個過程會讓人類越來越強大。

但奧特曼并不否認過分強大的 AGI“可能殺死人類”這一觀點：

我必須承認，（AI 殺死人類）有一定可能性。
很多關于 AI 安全和挑戰(zhàn)的預測被證明是錯誤的，我們必須正視這一點，并盡早嘗試找到解決問題的方法。

One More Thing

在談話最后，Lex Fridman 還試圖讓奧特曼講一些給年輕人們的建議，奧特曼直接來了個“反雞湯文學”：

網(wǎng)絡上的“成功學”帖子太誘人，建議不要聽太多建議。
我就是無視建議做到現(xiàn)在這樣的。

參考鏈接：

https://www.youtube.com/watch?v=L_Guz73e6fw

本文來自微信公眾號：量子位（ID：QbitAI），作者：Pine 蕭簫金磊

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：ChatGPT，OpenAI

GPT-4 老板：AI 可能會殺死人類，已經(jīng)出現(xiàn)我們無法解釋的推理能力

GPT-4 內幕大曝光

最會打太極的 CEO

GPT 的“偏見”不會消失

One More Thing

相關文章