AI 聊天機器人大戰(zhàn)升溫：谷歌 Gemini 預(yù)告片展示驚艷語音視頻交互能力

2024/5/14 18:06:23 來源：IT之家作者：遠洋責編：遠洋

評論：

IT之家 5 月 14 日消息，人工智能聊天機器人領(lǐng)域烽煙再起，谷歌和 OpenAI 之間激烈的競爭態(tài)勢愈演愈烈。就在谷歌一年一度的 I / O 開發(fā)者大會召開前夕，這家科技巨頭發(fā)布了一段視頻，展示了疑似經(jīng)過升級的 Gemini 聊天機器人。視頻中，Gemini 可以同時實時處理來自視頻和語音的輸入。

這段視頻貌似是在 I / O 大會搭建現(xiàn)場拍攝的，視頻展示了 Gemini 在一臺 Pixel 手機上流暢地處理實時視頻和語音提問，并準確地提供信息。當被問到正在進行的布置工作時，Gemini 正確識別出這是為一個重要活動做的準備。

整個對話過程自然流暢，Gemini 還會詢問用戶注意到的細節(jié)，成功識別出了該活動為谷歌 I / O 開發(fā)者大會，并進行了簡要介紹。

谷歌發(fā)布該預(yù)告片的時機非常巧妙，恰好在 OpenAI 有關(guān) ChatGPT 的發(fā)布會前幾個小時，OpenAI 在此發(fā)布會上推出了全新的 ChatGPT-4o 大模型，其理解和對話的流暢性以及連貫性方面都達到了無與倫比的水平。

雖然過去的一些演示視頻讓外界對這類內(nèi)容持有一定的懷疑態(tài)度，但今天展示的案例無疑證實了人工智能聊天機器人可以無縫集成語音和視頻輸入。這種多模態(tài)能力，加上非常自然的對話流，讓我們仿佛看到了未來人工智能交互的一瞥。

谷歌 I / O 大會主題演講將于明天凌晨 1 點舉行，屆時IT之家將第一時間帶來相關(guān)報道。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

AI 聊天機器人大戰(zhàn)升溫：谷歌 Gemini 預(yù)告片展示驚艷語音視頻交互能力

相關(guān)文章