設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 總裁:GPT-4 并不完美但卻絕對(duì)與眾不同

2023/3/16 8:07:20 來(lái)源:網(wǎng)易科技 作者:小小 責(zé)編:問(wèn)舟

3 月 16 日消息,人工智能研究公司 OpenAI 于昨日發(fā)布了備受期待的文本生成 AI 模型 GPT-4。OpenAI 聯(lián)合創(chuàng)始人兼總裁格雷格?布羅克曼(Greg Brockman)在接受采訪時(shí)表示,GPT-4 并不完美,但卻絕對(duì)與眾不同。

Two people sitting together on a couch in a sunlit room, talking over their laptops

GPT-4 在其前身 GPT-3 的基礎(chǔ)上,在許多關(guān)鍵方面進(jìn)行了改進(jìn),例如提供了更多真實(shí)的陳述,并允許開(kāi)發(fā)人員更容易控制其風(fēng)格和行為。從某種意義上說(shuō),GPT-4 也是多模式的,因?yàn)樗梢岳斫鈭D像,能給照片添加注釋,甚至詳細(xì)描述照片中的內(nèi)容。

但 GPT-4 也有嚴(yán)重的缺陷。就像 GPT-3 一樣,該模型會(huì)產(chǎn)生“幻覺(jué)”(即模型聚合的文本與源文本無(wú)關(guān)或不夠準(zhǔn)確),并會(huì)犯下基本的推理錯(cuò)誤。OpenAI 在自己的博客上舉了一個(gè)例子,GPT-4 將“貓王”埃爾維斯?普雷斯利(Elvis Presley)描述為“演員的兒子”,但實(shí)際上他的父母都不是演員。

當(dāng)被要求將 GPT-4 與 GPT-3 進(jìn)行比較時(shí),布羅克曼只給出了四個(gè)字回答:與眾不同。他解釋稱:“GPT-4 絕對(duì)與眾不同,盡管它還存在很多問(wèn)題和錯(cuò)誤。但你可以看到其在微積分或法律等學(xué)科技能方面的躍升。它在某些領(lǐng)域的表現(xiàn)曾很糟糕,現(xiàn)在卻已經(jīng)達(dá)到超越普通人的水準(zhǔn)?!?/p>

測(cè)試結(jié)果支持了布羅克曼的觀點(diǎn)。在高考微積分考試中,GPT-4 得 4 分 (滿分 5 分),GPT-3 得 1 分,介于 GPT-3 和 GPT-4 之間的 GPT-3.5 也得 4 分。在模擬律師考試中,GPT-4 成績(jī)進(jìn)入了前 10% 行列,而 GPT-3.5 的分?jǐn)?shù)在后 10% 左右徘徊。

與此同時(shí),GPT-4 更受人關(guān)注的地方在于上面提到的多模式。與 GPT-3 和 GPT-3.5 不同,它們只能接受文本提示,例如可以要求“寫(xiě)一篇關(guān)于長(zhǎng)頸鹿的文章”,而 GPT-4 可以同時(shí)接受圖像和文本提示來(lái)執(zhí)行某些操作,比如識(shí)別在塞倫蓋蒂拍攝的長(zhǎng)頸鹿圖像,并給出基本的內(nèi)容描述。

這是因?yàn)?GPT-4 是針對(duì)圖像和文本數(shù)據(jù)進(jìn)行培訓(xùn)的,而它的前身只針對(duì)文本進(jìn)行了培訓(xùn)。OpenAI 表示,培訓(xùn)數(shù)據(jù)來(lái)自“各種合法授權(quán)的、公開(kāi)可用的數(shù)據(jù)源,其中可能包括公開(kāi)可用的個(gè)人信息”,但當(dāng)被要求提供細(xì)節(jié)時(shí),布羅克曼表示拒絕。訓(xùn)練數(shù)據(jù)以前也曾讓 OpenAI 陷入法律糾紛。

GPT-4 的圖像理解能力給人留下了相當(dāng)深刻的印象。例如,輸入提示“這張圖片有什么好笑的?GPT-4 會(huì)將整張圖片分解,并正確地解釋了這個(gè)笑話的笑點(diǎn)。

目前,只有一個(gè)合作伙伴可以使用 GPT-4 的圖像分析功能,這是一款針對(duì)視障人士的輔助應(yīng)用程序,名為 Be My Eyes。布羅克曼說(shuō),在 OpenAI 評(píng)估風(fēng)險(xiǎn)和利弊的過(guò)程中,無(wú)論何時(shí),更廣泛的推廣都將是“緩慢而有意的”。

他還稱:“有些政策問(wèn)題也需要解決,比如面部識(shí)別和如何處理人的圖像。我們需要找出危險(xiǎn)區(qū)域在哪里,紅線在哪里,然后隨著時(shí)間的推移找到解決方案。”

OpenAI 在其文本到圖像轉(zhuǎn)換系統(tǒng) Dall-E 2 上也遇到了類似倫理困境。在最初禁用該功能后,OpenAI 允許客戶上傳人臉,以使用 AI 支持的圖像生成系統(tǒng)對(duì)其進(jìn)行編輯。當(dāng)時(shí),OpenAI 聲稱,其安全系統(tǒng)的升級(jí)使面部編輯功能成為可能,因?yàn)樗鼘⑸疃仍旒僖约霸噲D創(chuàng)造色 情、政治和暴力內(nèi)容的潛在危害降至最低。

另一個(gè)長(zhǎng)期問(wèn)題是防止 GPT-4 在無(wú)意中被用于可能造成傷害的方式使用。該模型發(fā)布幾小時(shí)后,以色列網(wǎng)絡(luò)安全初創(chuàng)公司 Adversa AI 發(fā)布了一篇博客文章,演示了繞過(guò) OpenAI 的內(nèi)容過(guò)濾器并讓 GPT-4 生成釣魚(yú)電子郵件、對(duì)同性戀者的攻擊性描述以及其他令人反感文本的方法。

這在語(yǔ)言模型領(lǐng)域并不是新問(wèn)題。Facebook 母公司 Meta 的聊天機(jī)器人 BlenderBot 和 OpenAI 的 ChatGPT 也曾被誘惑輸出不恰當(dāng)?shù)膬?nèi)容,甚至透露了它們內(nèi)部工作的敏感細(xì)節(jié)。但包括記者在內(nèi)的許多人曾希望,GPT-4 可能會(huì)在這方面帶來(lái)重大改進(jìn)。

當(dāng)被問(wèn)及 GPT-4 的健壯性時(shí),布羅克曼強(qiáng)調(diào),該模型已經(jīng)經(jīng)過(guò)了六個(gè)月的安全培訓(xùn)。在內(nèi)部測(cè)試中,它對(duì) OpenAI 使用政策不允許的內(nèi)容請(qǐng)求做出響應(yīng)的可能性比 GPT-3.5 低 82%,產(chǎn)生“事實(shí)”響應(yīng)的可能性比 GPT-3.5 高 40%。

布羅克曼說(shuō):“我們花了很多時(shí)間試圖了解 GPT-4 的能力。我們正在不斷更新,包括一系列改進(jìn),這樣該模型就更具可擴(kuò)展性,以適應(yīng)人們希望它擁有的個(gè)性或模式?!?/p>

坦率地說(shuō),早期的現(xiàn)實(shí)測(cè)試結(jié)果并不是那么讓人滿意。除了 Adversa AI 測(cè)試之外,微軟的聊天機(jī)器人 Bing Chat 也被證明非常容易越獄。使用精心設(shè)計(jì)的輸入,用戶能夠讓該聊天機(jī)器人表達(dá)愛(ài)意,發(fā)出威脅傷害,為大屠殺辯護(hù),并發(fā)明陰謀論。

布羅克曼并未否認(rèn) GPT-4 在這方面的不足,但他強(qiáng)調(diào)了該模型的新限制工具,包括被稱為“系統(tǒng)”消息的 API 級(jí)功能。系統(tǒng)消息本質(zhì)上是為 GPT-4 的交互設(shè)定基調(diào)并建立界限的指令。例如,一條系統(tǒng)消息可能是這樣寫(xiě)的:“你是一位總是以蘇格拉底風(fēng)格回答問(wèn)題的導(dǎo)師。你永遠(yuǎn)不會(huì)給學(xué)生答案,而是總是試著問(wèn)正確的問(wèn)題,幫助他們學(xué)會(huì)獨(dú)立思考?!?/p>

其思想是,系統(tǒng)消息充當(dāng)護(hù)欄,防止 GPT-4 偏離軌道。布羅克曼說(shuō):“真正弄清楚 GPT-4 的語(yǔ)氣、風(fēng)格和實(shí)質(zhì)一直是我們非常關(guān)注的問(wèn)題。我認(rèn)為我們開(kāi)始更多地了解如何進(jìn)行工程設(shè)計(jì),如何擁有一個(gè)可重復(fù)的過(guò)程,讓你得到對(duì)人們真正有用的可預(yù)測(cè)結(jié)果。”

布羅克曼還提到了 Evals,這是 OpenAI 最新的開(kāi)源軟件框架,用于評(píng)估其 AI 模型的性能,這是 OpenAI 致力于“增強(qiáng)”其模型的標(biāo)志。Evals 允許用戶開(kāi)發(fā)和運(yùn)行評(píng)估模型 (如 GPT-4) 的基準(zhǔn)測(cè)試,同時(shí)檢查它們的性能,這是一種眾包的模型測(cè)試方法。

布羅克曼說(shuō):“有了 Evals,我們可以更好地看到用戶關(guān)心的用例,并可以對(duì)其進(jìn)行測(cè)試。我們之所以開(kāi)源這個(gè)框架,部分原因是我們不再每隔三個(gè)月發(fā)布一個(gè)新模型以不斷改進(jìn)。你不會(huì)制造你不能測(cè)量的東西,對(duì)吧?但隨著我們推出新版模型,我們至少可以知道發(fā)生了哪些變化。”

布羅克曼還被問(wèn)道,OpenAI 是否會(huì)補(bǔ)償人們用 Evals 測(cè)試它的模型?他不愿就此做出承諾,但他確實(shí)指出,在有限的時(shí)間內(nèi),OpenAI 允許提出申請(qǐng)的 Eevals 用戶提前訪問(wèn) GPT-4 API。

布羅克曼還談到了 GPT-4 的上下文窗口,該窗口指的是模型在生成額外文本之前可以考慮的文本。OpenAI 正在測(cè)試一種版本的 GPT-4,它可以“記住”大約 50 頁(yè)內(nèi)容,是普通 GPT-4“內(nèi)存”的 5 倍,是 GPT-3 的 8 倍。

布羅克曼認(rèn)為,擴(kuò)展的上下文窗口會(huì)帶來(lái)新的、以前從未探索過(guò)的用例,特別是在企業(yè)中。他設(shè)想了一款為公司打造的 AI 聊天機(jī)器人,它可以利用來(lái)自不同來(lái)源 (包括各部門(mén)員工) 的背景和知識(shí),以一種非常內(nèi)行但具有對(duì)話性的方式回答問(wèn)題。

這并不是一個(gè)新概念。但布羅克曼認(rèn)為,GPT-4 的答案將比目前其他聊天機(jī)器人和搜索引擎提供的答案有用得多。他說(shuō):“以前,模型根本不知道你是誰(shuí),你對(duì)什么感興趣等。而擁有更大的上下文窗口肯定會(huì)讓它變得更強(qiáng),從而大大增強(qiáng)它能為人們提供的支持。”

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:GPT4ChatGPT,OpenAI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知