設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌發(fā)言人承認(rèn):Gemini AI 演示視頻內(nèi)容和語(yǔ)音提示均非實(shí)時(shí)錄制

2023/12/9 13:50:32 來(lái)源:IT之家 作者:清源(實(shí)習(xí)) 責(zé)編:清源
感謝IT之家網(wǎng)友 Coje_He 的線索投遞!

IT之家 12 月 9 日消息,據(jù)彭博社、Tom's Hardware 等外媒當(dāng)?shù)貢r(shí)間周五報(bào)道,谷歌發(fā)言人在采訪中承認(rèn),前段時(shí)間谷歌發(fā)布的大語(yǔ)言模型 Gemini 演示視頻并非實(shí)時(shí)錄制。

乍看之下,這個(gè)一鏡到底的視頻中,Gemini 模型可發(fā)現(xiàn)藏在指定塑料杯內(nèi)的紙團(tuán),或者看出一張“連點(diǎn)成線”的圖片畫(huà)的是螃蟹。但是,谷歌發(fā)言人告訴彭博社,這段演示視頻是利用鏡頭中的靜止圖像幀和文字提示“拼湊”而成的,Gemini 只能對(duì)輸入的提示和靜態(tài)圖像做出反應(yīng)。同樣,視頻中用戶與 Gemini 的語(yǔ)音互動(dòng)也由后期配音完成。

至于視頻中的人物說(shuō)話、繪畫(huà)、展示物品乃至魔術(shù),似乎也只是為了演示視頻而特意安排的。在谷歌官方 YouTube 頻道中,谷歌也添加了描述稱“為了演示的目的,延遲已經(jīng)減少,Gemini 的輸出也縮短了,以求簡(jiǎn)潔”。這意味著 Gemini 每次響應(yīng)所需的時(shí)間實(shí)際上要長(zhǎng)于視頻的演示。

此外,谷歌 DeepMind 研究副總裁兼深度學(xué)習(xí)負(fù)責(zé)人 Oriol Vinyals 也對(duì)這段視頻做進(jìn)一步解釋:這段視頻展示的是使用 Gemini 構(gòu)建的多模態(tài)用戶體驗(yàn)“可能的樣子”,是為了激發(fā)開(kāi)發(fā)人員的靈感。其稱,視頻中的所有用戶提示和輸出都是真實(shí)的,為簡(jiǎn)潔起見(jiàn)進(jìn)行了縮短。而且,視頻中展示的模型為 Gemini Ultra。

據(jù)IT之家此前報(bào)道,谷歌曾聲稱 Gemini Ultra 的性能在 32 個(gè)廣泛使用的學(xué)術(shù)基準(zhǔn)測(cè)試中有 30 個(gè)都表現(xiàn)出了超越當(dāng)前時(shí)代的“先進(jìn)結(jié)果”,而這些基準(zhǔn)測(cè)試也是當(dāng)前 LLM 領(lǐng)域最常用、最泛用的測(cè)試。

其中,它以 90.0% 的得分成為第一個(gè)在 MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)上超越人類專家的模型(該測(cè)試結(jié)合了數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等 57 個(gè)學(xué)科)。

Gemini Ultra 還在新的 MMMU 基準(zhǔn)測(cè)試上表現(xiàn)出了 59.4% 的領(lǐng)先級(jí)性能,該測(cè)試涵蓋了“需要深思熟慮的”不同領(lǐng)域的多模態(tài)任務(wù)。

明年初,谷歌還將推出全新升級(jí)的 Bard Advanced,讓用戶可以更好地體驗(yàn)到其最好的模型和功能,也就是 Gemini Ultra。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌,Gemini

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知