OpenAI 發(fā)布全新旗艦生成式 AI 模型 GPT-4o：語(yǔ)音對(duì)話更流暢，免費(fèi)提供

2024/5/14 1:25:13 來(lái)源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評(píng)論：

感謝IT之家網(wǎng)友 HH_KK 的線索投遞！

IT之家 5 月 14 日消息，OpenAI 宣布推出其最新旗艦生成式 AI 模型 GPT-4o，該模型將在未來(lái)幾周內(nèi)分階段集成至 OpenAI 的各個(gè)產(chǎn)品之中。最讓人驚喜的是，GPT-4o 將免費(fèi)提供給所有用戶使用。

綜合 TechCrunch 等外媒報(bào)道，OpenAI 首席技術(shù)官穆里?穆拉蒂 (Muri Murati) 表示，GPT-4o 將提供與 GPT-4 同等水平的智能，但在文本、圖像以及語(yǔ)音處理方面均取得了進(jìn)一步提升。

“GPT-4o 可以綜合利用語(yǔ)音、文本和視覺(jué)信息進(jìn)行推理，”穆拉蒂在 OpenAI 公司總部舉行的主題演講中表示。GPT-4 是 OpenAI 此前的旗艦?zāi)Ｐ?，可以處理由圖像和文本混合而成的信息，并能完成諸如從圖像中提取文字或描述圖像內(nèi)容等任務(wù)，GPT-4o 則在此基礎(chǔ)上新增了語(yǔ)音處理能力。

GPT-4o 的運(yùn)行速度將大大提升，最大亮點(diǎn)在于其語(yǔ)音交互模式采用了新技術(shù)。OpenAI 一直致力于讓用戶通過(guò)語(yǔ)音與 ChatGPT 進(jìn)行交流，仿佛與真人對(duì)話一般。然而，之前的版本由于延遲問(wèn)題，嚴(yán)重影響了對(duì)話的沉浸感。GPT-4o 則采用了全新的技術(shù)，讓聊天機(jī)器人對(duì)話的響應(yīng)速度大幅提升。

IT之家注意到，發(fā)布會(huì)上 OpenAI 展示了使用 GPT-4o 進(jìn)行語(yǔ)音對(duì)話的演示。演示者提問(wèn)結(jié)束后，GPT-4o 幾乎可以即時(shí)回應(yīng)，并通過(guò)文本轉(zhuǎn)語(yǔ)音功能進(jìn)行朗讀，讓對(duì)話感覺(jué)更加自然逼真。

另一個(gè)演示展示了 GPT-4o 根據(jù)要求調(diào)整說(shuō)話時(shí)語(yǔ)氣，GPT-4o 可以根據(jù)指令改變聲音，從夸張戲劇到冰冷機(jī)械，展現(xiàn)了出色的可塑性。最后，演示還展示了 GPT-4o 的唱歌功能。

以往，OpenAI 發(fā)布新版 ChatGPT 模型時(shí)，通常會(huì)將其置于付費(fèi)墻之后。不過(guò)這次 GPT-4o 將免費(fèi)提供給所有用戶，付費(fèi)用戶則可以享受五倍的調(diào)用額度。

此外，OpenAI 還發(fā)布了桌面版的 ChatGPT 和新的用戶界面。“我們認(rèn)識(shí)到這些模型正變得越來(lái)越復(fù)雜，” 穆拉蒂說(shuō)道，“但我們希望用戶與人工智能模型的交互體驗(yàn)?zāi)軌蚋幼匀弧⑤p松，讓用戶可以將注意力完全集中在與模型的協(xié)作上，而無(wú)需在意界面本身?！?/p>

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

OpenAI 發(fā)布全新旗艦生成式 AI 模型 GPT-4o：語(yǔ)音對(duì)話更流暢，免費(fèi)提供

相關(guān)文章

OpenAI 發(fā)布全新旗艦生成式 AI 模型 GPT-4o：語(yǔ)音對(duì)話更流暢，免費(fèi)提供