設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
小米 YU7 中文命名为“御 7”    谷歌仍将在 AOSP 发布完整安卓源代码

消息稱 OpenAI 將推出多模態(tài)人工智能數字助理:可語音對話、識別物體

2024/5/12 15:29:09 來源:IT之家 作者:遠洋 責編:遠洋

IT之家 5 月 12 日消息,據 The Information 報道,OpenAI 最近向部分客戶展示了一款新型多模態(tài)人工智能模型,該模型能夠進行語音對話和物體識別。有消息人士透露,這或許就是 OpenAI 計劃在即將到來的 5 月 13 日正式發(fā)布的內容之一。

圖源 Pexels

報道稱,相比于 OpenAI 現有的獨立圖像識別和文本轉語音模型,該新型模型能夠更快、更準確地處理圖像和音頻信息。例如,它可以幫助客服人員“更好地理解來電者的語氣語調,判斷他們是否在使用諷刺語氣”。理論上,該模型還能輔助學生學習數學知識,或翻譯現實世界中的標志文字。

不過,消息人士也指出,雖然該模型在某些問題解答方面能夠超越 GPT-4 Turbo,但仍有可能出現自信地給出錯誤答案的情況。

IT之家注意到,開發(fā)者 Ananay Arora 發(fā)布了一張包含通話相關代碼的截圖,暗示 OpenAI 可能正在為 ChatGPT 加入打電話的功能。Arora 還發(fā)現了一些證據表明 OpenAI 正在配置用于實時音視頻通信的服務器。

OpenAI 首席執(zhí)行官薩姆?阿爾特曼 (Sam Altman) 已經明確否認即將發(fā)布的新品是代號為 GPT-5 的大型語言模型(據稱其性能將大幅優(yōu)于 GPT-4)。The Information 則表示,GPT-5 可能將在今年年底前正式亮相。阿爾特曼還表示,OpenAI 不會發(fā)布新的人工智能搜索引擎。

如果 The Information 的報道屬實,OpenAI 的新品發(fā)布仍可能會對即將舉行的 Google I / O 開發(fā)者大會產生一定影響。眾所周知,谷歌也在測試利用人工智能進行電話呼叫的技術。此外,谷歌還有一個據傳即將發(fā)布的項目,代號為“Pixie”。Pixie 是一款能夠通過設備攝像頭識別物體的多模態(tài) Google Assistant 替代品,可以為用戶提供諸如“如何前往購買地點”或“如何使用”等信息。

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:OpenAI,人工智能
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網站: IT之家 最會買 - 返利返現優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知