設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

考試能力超 90% 人類的 OpenAI GPT-4 發(fā)布,網(wǎng)友們?yōu)楣ぷ鲹?dān)憂和哀嚎

2023/3/15 8:49:37 來源:網(wǎng)易科技 作者:楊勝忠 責(zé)編:瀟公子

今天凌晨,OpenAI 公布了其大型語言模型的最新版本 ——GPT-4。該公司表示,GPT-4 在許多專業(yè)測(cè)試中表現(xiàn)出超過絕大多數(shù)人類的水平。

具體而言,GPT-4 實(shí)現(xiàn)了以下幾個(gè)方面的飛躍式提升:更聰明,做題水平越來越好;支持圖像輸入,擁有強(qiáng)大的識(shí)圖能力,但目前只限內(nèi)部測(cè)試;更長的上下文,文字輸入限制提升至 2.5 萬字;回答準(zhǔn)確性顯著提高;更安全,有害信息更少

對(duì)于普通人而言,如何理解 GPT-4 到底有多強(qiáng)多聰明?

據(jù) OpenAI 透露,GPT-4 通過了所有基礎(chǔ)考試而且是高分通過。例如,GPT-4 在模擬律師資格考試的成績?cè)诳忌信琶?10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數(shù)學(xué)考試中排名前 11% 左右。相比之下,曾經(jīng)令人震撼的 GPT-3.5 ,真實(shí)得分在倒數(shù) 10% 左右,GPT-4 的強(qiáng)大已經(jīng)可想而知。

有網(wǎng)友評(píng)論,“如果真跟報(bào)告說的那樣就太可怕了,我感覺能力已經(jīng)遠(yuǎn)超我了?!币灿腥诵ΨQ,“我躺好了!我生在了適合我的時(shí)代!”

最多的聲音則是對(duì)未來工作不保的擔(dān)憂,“還有哪個(gè)行業(yè)可以不被替代?”“消除任何幻想,AI 時(shí)代橫掃全球,先思考下 GPT-4 不能做但你能做的?!?/p>

比以前的版本“更大”,或許也更燒錢

OpenAI 稱,GPT-4 比以前的版本“更大”,這意味著其已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,這使得它的運(yùn)行成本更高。

同時(shí),OpenAI 并未公布這個(gè)模型的參數(shù)量有多少。

OpenAI 表示,它使用的是微軟 (MSFT.US) Azure 訓(xùn)練模型,微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI 沒有公布具體模型大小的細(xì)節(jié),也沒有公布用來訓(xùn)練模型的硬件,理由是“競(jìng)爭(zhēng)情況”。

目前,此領(lǐng)域的許多研究人員認(rèn)為,人工智能領(lǐng)域的許多最新進(jìn)展,都來自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來越大的模型,這些模型的訓(xùn)練過程可能耗資數(shù)千萬美元。

為了不斷提高 GPT-4 性能,OpenAI 還為其研發(fā)大搞“基建”。

在過去的兩年里,OpenAI 重建了整個(gè)深度學(xué)習(xí)堆棧,并與 Azure 一起為其工作負(fù)載從頭開始設(shè)計(jì)了一臺(tái)超級(jí)計(jì)算機(jī)。一年前,OpenAI 在訓(xùn)練 GPT-3.5 時(shí)第一次嘗試運(yùn)行了該超算系統(tǒng),之后他們又陸續(xù)發(fā)現(xiàn)并修復(fù)了一些錯(cuò)誤,改進(jìn)了其理論基礎(chǔ)。這些改進(jìn)的結(jié)果是 GPT-4 的訓(xùn)練運(yùn)行獲得了前所未有的穩(wěn)定。

OpenAI 聯(lián)合創(chuàng)始人兼總裁格雷格?布羅克曼(Greg Brockman)表示,OpenAI 預(yù)計(jì),未來將由投資十億美元超級(jí)計(jì)算機(jī)的公司開發(fā)尖端模型,一些最先進(jìn)的工具將帶有風(fēng)險(xiǎn)。OpenAI 希望對(duì)他們工作的某些部分保密,以給初創(chuàng)公司“一些喘息的空間,以真正關(guān)注安全并做好它?!?/p>

局限性明顯,GPT-4 仍然不完全可靠

盡管功能已經(jīng)非常強(qiáng)大,但 GPT-4 仍與早期的 GPT 模型具有相似的局限性,其中最重要的一點(diǎn)是它仍然不完全可靠,也就是還有可能胡說八道。

OpenAI 也警告稱,GPT-4 還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4 仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見、幻覺和對(duì)抗性提示。”

總的來說,GPT-4 相對(duì)于以前的模型(經(jīng)過多次迭代和改進(jìn))已經(jīng)顯著減輕了幻覺問題。在 OpenAI 的內(nèi)部對(duì)抗性真實(shí)性評(píng)估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%。

同時(shí),GPT-4 訓(xùn)練數(shù)據(jù)還是截止到 2021 年 9 月份。這也意味著,GPT-4 對(duì)于這個(gè)時(shí)間點(diǎn)以后的信息,缺乏足夠的了解,也不會(huì)從其經(jīng)驗(yàn)中學(xué)習(xí)。

在 GPT-4 發(fā)布之后,OpenAI 創(chuàng)始人阿爾特曼發(fā)推文表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的時(shí)間第一次使用它時(shí),它似乎比實(shí)際情況更令人印象深刻?!?/p>

中國的 ChatGPT 們要怎么追?

最令人震驚的在于,按照 demo 視頻里 OpenAI 工程師們的說法,GPT-4 的訓(xùn)練在去年 8 月就已經(jīng)完成,剩下的時(shí)間都在進(jìn)行微調(diào)提升,以及最重要的去除危險(xiǎn)內(nèi)容生成的工作。

這也意味著,OpenAI 內(nèi)部技術(shù),比大家想象中的領(lǐng)先外界更多年。更可怕的是,OpenAI 還一口氣開放了 API 接口和相關(guān)論文!這讓中國的 ChatGPT 們還怎么追?

英諾天使基金合伙人王晟曾告訴《態(tài)℃》欄目,“中國的 ChatGPT 們即便奮起直追,靜態(tài)來講也許兩三年能追上,我認(rèn)為已經(jīng)很樂觀了?!?/p>

但隨著更強(qiáng)大的 GPT-4 發(fā)布,OpenAI 的技術(shù)能力顯然仍在不斷進(jìn)步,且進(jìn)展速度遠(yuǎn)比我們追的速度還要快。王晟在之前的采訪中判斷,“除非這件事突然遇到了一個(gè)瓶頸,整個(gè)科技發(fā)展方向到頭了,對(duì)方不得不停下來,或許我們還有機(jī)會(huì)追平,或者我們挖掘到一種新的技術(shù)路徑有機(jī)會(huì)追上,不然可能沒有機(jī)會(huì)了?!?/p>

與此同時(shí),在該模型的落地和應(yīng)用方面,OpenAI 也有了最新進(jìn)展。

新模型將提供給 ChatGPT 的付費(fèi)用戶,也將作為 API 的一部分提供,允許程序員將 AI 集成到他們的應(yīng)用程序中。OpenAI 將對(duì) 750 字左右的指令信息收費(fèi) 3 美分,對(duì) 750 字左右的響應(yīng)信息收費(fèi) 6 美分。

OpenAI 還介紹,摩根士丹利正在使用 GPT-4 來組織數(shù)據(jù),而電子支付公司 Stripe 正在測(cè)試 GPT-4 是否有助于打擊欺詐。其他客戶還包括語言學(xué)習(xí)公司 Duolingo、Khan Academy 和冰島政府。OpenAI 合作伙伴微軟周二表示,新版必應(yīng)搜索引擎將使用 GPT-4。

GPT-4 取得的成績令人興奮,但對(duì)于還在起跑線上的中國 ChatGPT 們,還有大量的工作要去探索和研究,想必感受到了巨大的壓力。風(fēng)浪越大魚越貴,對(duì)于這些迅速進(jìn)入這個(gè)新領(lǐng)域的公司來說,也將會(huì)擁有巨大的機(jī)會(huì)。

GPT-4 的強(qiáng)大告誡我們,未來唯一限制的因素,就是你的想象力!

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI,模型,GPT4

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知