設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

ChatGPT 更聰明了!OpenAI 推出 GPT-4 大型語(yǔ)言模型:在諸多測(cè)試中表現(xiàn)比人類都好

2023/3/15 7:04:02 來(lái)源:IT之家 作者:問(wèn)舟 責(zé)編:問(wèn)舟
感謝IT之家網(wǎng)友 蔥花我愛(ài)吃巧遇.、Stephen_233、Sean_冬瓜、秦淮一夢(mèng)、ttbtb、滑溜的肥皂LL J、烏蠅哥的左手、Neko_233、大眼夾、流汗黃豆 的線索投遞!

IT之家 3 月 15 日消息,Open-AI 剛剛公布了其大型語(yǔ)言模型的最新版本 ——GPT-4API 候補(bǔ)申請(qǐng)點(diǎn)此)。

GPT-4 可以更準(zhǔn)確地解決你的難題,多模態(tài)的 GPT-4 還可以生成、編輯具有創(chuàng)意性或技術(shù)性的文章,在高級(jí)推理方面的表現(xiàn)超過(guò)其前輩(當(dāng)前公開版 ChatGPT 基于 GPT-3.5)。當(dāng)然,正如大家所猜測(cè)的那樣,微軟 New Bing 的聊天功能確實(shí)基于 GPT-4。

此外,該公司正在與合作伙伴 Be My Eyes 一起測(cè)試 GPT-4 的圖像輸入能力(注:Be My Eyes 是一款即將推出的智能手機(jī) App,可以識(shí)別場(chǎng)景并對(duì)其進(jìn)行描述,類似于大家常見的 AI 識(shí)圖的加強(qiáng)版)。

除了介紹網(wǎng)站,OpenAI 還提供了描述 GPT-4 功能的技術(shù)性論文,以及詳細(xì)描述其局限性的系統(tǒng)模型 Card。

OpenAI 計(jì)劃通過(guò) ChatGPT 及其商業(yè) API 為用戶提供 GPT-4 的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4 目前僅 ChatGPT plus 賬號(hào)可用,可選 GPT4 模式進(jìn)行對(duì)話,每 4 小時(shí)限制發(fā)送 100 條消息。

收費(fèi)方面,大約 750 個(gè)單詞的提示收取約 3 美分的費(fèi)用,約 750 個(gè)單詞的響應(yīng)則收取 6 美分(就是問(wèn)和答的區(qū)別)。

OpenAI 聲稱,ChatGPT-4 比迭代前的 GPT-3.5“更大”,這意味著它接受了更多的數(shù)據(jù)訓(xùn)練,模型文件中有更多的權(quán)重(參數(shù)),這也使得它的運(yùn)行成本更高。

該公司聲稱,該模型“比以往任何時(shí)候都更具創(chuàng)造性和協(xié)作性”,“可以更準(zhǔn)確地解決難題”。它可以解析文本和圖像輸入,盡管它只能通過(guò)文本進(jìn)行響應(yīng)。

就任務(wù)而言,GPT-4 的表現(xiàn)比前輩更好,它可以遵循自然語(yǔ)言的復(fù)雜指令并生成技術(shù)或創(chuàng)意內(nèi)容,而且它可以還更深入地做到這一點(diǎn):它支持生成和處理多達(dá) 32768 個(gè)標(biāo)記(約 25000 個(gè)文本單詞),從而實(shí)現(xiàn)比前輩更長(zhǎng)的內(nèi)容創(chuàng)建或文本分析。

OpenAI 承認(rèn),該公司使用了微軟云計(jì)算平臺(tái) Azure 來(lái)訓(xùn)練其模型,微軟已經(jīng)向 OpenAI 投資了數(shù)十億美元。OpenAI 以競(jìng)爭(zhēng)為由,沒(méi)有公布具體的模型大小或用于訓(xùn)練它的硬件等細(xì)節(jié),這些細(xì)節(jié)可以用來(lái)重建模型。

官方表示,GPT-4 錯(cuò)誤答案更少,而且也會(huì)減少偏離話題的可能,也盡可能不會(huì)再談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得都要更好一些。

例如,GPT-4 在模擬律師考試的成績(jī)?cè)诳忌信琶?10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數(shù)學(xué)考試中排名前 11% 左右。相比之下,GPT-3.5 在律師考試中的得分一般都是倒數(shù) 10% 左右。當(dāng)然,它們考個(gè)研究生還是沒(méi)問(wèn)題的。

當(dāng)然,AI 畢竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多場(chǎng)景下的能力都不如人類。

據(jù)稱,該模型仍然存在“幻覺(jué)”或編造事實(shí)的問(wèn)題,并且在事實(shí)方面也不一定總是可靠的,“它傾向于堅(jiān)持認(rèn)為它是正確的,即使它錯(cuò)了”。OpenAI 表示,GPT-4 正在努力解決其局限性,例如社會(huì)偏見、幻覺(jué)和敵意回復(fù)等。

在一次隨意的談話中,GPT-3.5 和 GPT-4 之間的區(qū)別很小。而當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會(huì)顯現(xiàn)出來(lái):GPT-4 比 GPT-3.5 更可靠、更有創(chuàng)造力,并且能夠處理更多細(xì)微差別的指令?!?/p>

OpenAI 表示,該公司已經(jīng)與多家公司合作以將 GPT-4 整合到他們的產(chǎn)品中,包括 Duolingo、Stripe 和 Khan Academy 等。這款新模型通過(guò) OpenAI 每月 20 美元的 ChatGPT 訂閱服務(wù) ChatGPT Plus 向用戶開放,并為微軟的必應(yīng)聊天機(jī)器人提供動(dòng)力。同時(shí),GPT-4 也將作為 API 的一部分提供,該 API 允許程序員將 AI 集成到自己的應(yīng)用程序中。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,OpenAIGPT4,ChatGPT

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知