考試能力超 90% 人類的 OpenAI GPT-4 發(fā)布，網(wǎng)友們?yōu)楣ぷ鲹?dān)憂和哀嚎

2023/3/15 8:49:37 來源：網(wǎng)易科技作者：楊勝忠 責(zé)編：瀟公子

評(píng)論：

今天凌晨，OpenAI 公布了其大型語言模型的最新版本 ——GPT-4。該公司表示，GPT-4 在許多專業(yè)測(cè)試中表現(xiàn)出超過絕大多數(shù)人類的水平。

具體而言，GPT-4 實(shí)現(xiàn)了以下幾個(gè)方面的飛躍式提升：更聰明，做題水平越來越好；支持圖像輸入，擁有強(qiáng)大的識(shí)圖能力，但目前只限內(nèi)部測(cè)試；更長的上下文，文字輸入限制提升至 2.5 萬字；回答準(zhǔn)確性顯著提高；更安全，有害信息更少。

對(duì)于普通人而言，如何理解 GPT-4 到底有多強(qiáng)多聰明？

據(jù) OpenAI 透露，GPT-4 通過了所有基礎(chǔ)考試而且是高分通過。例如，GPT-4 在模擬律師資格考試的成績?cè)诳忌信琶?10% 左右，在 SAT 閱讀考試中排名前 7% 左右，在 SAT 數(shù)學(xué)考試中排名前 11% 左右。相比之下，曾經(jīng)令人震撼的 GPT-3.5 ，真實(shí)得分在倒數(shù) 10% 左右，GPT-4 的強(qiáng)大已經(jīng)可想而知。

有網(wǎng)友評(píng)論，“如果真跟報(bào)告說的那樣就太可怕了，我感覺能力已經(jīng)遠(yuǎn)超我了?！币灿腥诵ΨQ，“我躺好了！我生在了適合我的時(shí)代！”

最多的聲音則是對(duì)未來工作不保的擔(dān)憂，“還有哪個(gè)行業(yè)可以不被替代？”“消除任何幻想，AI 時(shí)代橫掃全球，先思考下 GPT-4 不能做但你能做的?！?/p>

比以前的版本“更大”，或許也更燒錢

OpenAI 稱，GPT-4 比以前的版本“更大”，這意味著其已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練，并且在模型文件中有更多的權(quán)重，這使得它的運(yùn)行成本更高。

同時(shí)，OpenAI 并未公布這個(gè)模型的參數(shù)量有多少。

OpenAI 表示，它使用的是微軟 (MSFT.US) Azure 訓(xùn)練模型，微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI 沒有公布具體模型大小的細(xì)節(jié)，也沒有公布用來訓(xùn)練模型的硬件，理由是“競(jìng)爭(zhēng)情況”。

目前，此領(lǐng)域的許多研究人員認(rèn)為，人工智能領(lǐng)域的許多最新進(jìn)展，都來自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來越大的模型，這些模型的訓(xùn)練過程可能耗資數(shù)千萬美元。

為了不斷提高 GPT-4 性能，OpenAI 還為其研發(fā)大搞“基建”。

在過去的兩年里，OpenAI 重建了整個(gè)深度學(xué)習(xí)堆棧，并與 Azure 一起為其工作負(fù)載從頭開始設(shè)計(jì)了一臺(tái)超級(jí)計(jì)算機(jī)。一年前，OpenAI 在訓(xùn)練 GPT-3.5 時(shí)第一次嘗試運(yùn)行了該超算系統(tǒng)，之后他們又陸續(xù)發(fā)現(xiàn)并修復(fù)了一些錯(cuò)誤，改進(jìn)了其理論基礎(chǔ)。這些改進(jìn)的結(jié)果是 GPT-4 的訓(xùn)練運(yùn)行獲得了前所未有的穩(wěn)定。

OpenAI 聯(lián)合創(chuàng)始人兼總裁格雷格?布羅克曼（Greg Brockman）表示，OpenAI 預(yù)計(jì)，未來將由投資十億美元超級(jí)計(jì)算機(jī)的公司開發(fā)尖端模型，一些最先進(jìn)的工具將帶有風(fēng)險(xiǎn)。OpenAI 希望對(duì)他們工作的某些部分保密，以給初創(chuàng)公司“一些喘息的空間，以真正關(guān)注安全并做好它?！?/p>

局限性明顯，GPT-4 仍然不完全可靠

盡管功能已經(jīng)非常強(qiáng)大，但 GPT-4 仍與早期的 GPT 模型具有相似的局限性，其中最重要的一點(diǎn)是它仍然不完全可靠，也就是還有可能胡說八道。

OpenAI 也警告稱，GPT-4 還不完美，在許多情況下，它的能力不如人類。該公司表示：“GPT-4 仍有許多已知的局限性，我們正在努力解決，比如社會(huì)偏見、幻覺和對(duì)抗性提示。”

總的來說，GPT-4 相對(duì)于以前的模型（經(jīng)過多次迭代和改進(jìn)）已經(jīng)顯著減輕了幻覺問題。在 OpenAI 的內(nèi)部對(duì)抗性真實(shí)性評(píng)估中，GPT-4 的得分比最新的 GPT-3.5 模型高 40%。

同時(shí)，GPT-4 訓(xùn)練數(shù)據(jù)還是截止到 2021 年 9 月份。這也意味著，GPT-4 對(duì)于這個(gè)時(shí)間點(diǎn)以后的信息，缺乏足夠的了解，也不會(huì)從其經(jīng)驗(yàn)中學(xué)習(xí)。

在 GPT-4 發(fā)布之后，OpenAI 創(chuàng)始人阿爾特曼發(fā)推文表示：“它仍然是有缺陷的，仍然是有限的，在你花了更多的時(shí)間第一次使用它時(shí)，它似乎比實(shí)際情況更令人印象深刻?！?/p>

中國的 ChatGPT 們要怎么追？

最令人震驚的在于，按照 demo 視頻里 OpenAI 工程師們的說法，GPT-4 的訓(xùn)練在去年 8 月就已經(jīng)完成，剩下的時(shí)間都在進(jìn)行微調(diào)提升，以及最重要的去除危險(xiǎn)內(nèi)容生成的工作。

這也意味著，OpenAI 內(nèi)部技術(shù)，比大家想象中的領(lǐng)先外界更多年。更可怕的是，OpenAI 還一口氣開放了 API 接口和相關(guān)論文！這讓中國的 ChatGPT 們還怎么追？

英諾天使基金合伙人王晟曾告訴《態(tài)℃》欄目，“中國的 ChatGPT 們即便奮起直追，靜態(tài)來講也許兩三年能追上，我認(rèn)為已經(jīng)很樂觀了?！?/p>

但隨著更強(qiáng)大的 GPT-4 發(fā)布，OpenAI 的技術(shù)能力顯然仍在不斷進(jìn)步，且進(jìn)展速度遠(yuǎn)比我們追的速度還要快。王晟在之前的采訪中判斷，“除非這件事突然遇到了一個(gè)瓶頸，整個(gè)科技發(fā)展方向到頭了，對(duì)方不得不停下來，或許我們還有機(jī)會(huì)追平，或者我們挖掘到一種新的技術(shù)路徑有機(jī)會(huì)追上，不然可能沒有機(jī)會(huì)了?！?/p>

與此同時(shí)，在該模型的落地和應(yīng)用方面，OpenAI 也有了最新進(jìn)展。

新模型將提供給 ChatGPT 的付費(fèi)用戶，也將作為 API 的一部分提供，允許程序員將 AI 集成到他們的應(yīng)用程序中。OpenAI 將對(duì) 750 字左右的指令信息收費(fèi) 3 美分，對(duì) 750 字左右的響應(yīng)信息收費(fèi) 6 美分。

OpenAI 還介紹，摩根士丹利正在使用 GPT-4 來組織數(shù)據(jù)，而電子支付公司 Stripe 正在測(cè)試 GPT-4 是否有助于打擊欺詐。其他客戶還包括語言學(xué)習(xí)公司 Duolingo、Khan Academy 和冰島政府。OpenAI 合作伙伴微軟周二表示，新版必應(yīng)搜索引擎將使用 GPT-4。

GPT-4 取得的成績令人興奮，但對(duì)于還在起跑線上的中國 ChatGPT 們，還有大量的工作要去探索和研究，想必感受到了巨大的壓力。風(fēng)浪越大魚越貴，對(duì)于這些迅速進(jìn)入這個(gè)新領(lǐng)域的公司來說，也將會(huì)擁有巨大的機(jī)會(huì)。

GPT-4 的強(qiáng)大告誡我們，未來唯一限制的因素，就是你的想象力！

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

考試能力超 90% 人類的 OpenAI GPT-4 發(fā)布，網(wǎng)友們?yōu)楣ぷ鲹?dān)憂和哀嚎

比以前的版本“更大”，或許也更燒錢

局限性明顯，GPT-4 仍然不完全可靠

中國的 ChatGPT 們要怎么追？

相關(guān)文章

考試能力超 90% 人類的 OpenAI GPT-4 發(fā)布，網(wǎng)友們?yōu)楣ぷ鲹?dān)憂和哀嚎

比以前的版本“更大”，或許也更燒錢

局限性明顯，GPT-4 仍然不完全可靠

中國的 ChatGPT 們要怎么追？