設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
2025 上海车展:海量新车发布    iPhone 17 系列机模全家福曝光

谷歌計(jì)劃融合 Gemini 與 Veo 模型,打造全能 AI 助手

2025/4/13 8:53:57 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 咩咩洋 的線索投遞!

IT之家 4 月 13 日消息,谷歌 DeepMind 首席執(zhí)行官 Demis Hassabis 在由領(lǐng)英聯(lián)合創(chuàng)始人 Reid Hoffman 共同主持的播客節(jié)目 Possible 中透露,谷歌計(jì)劃將旗下的 Gemini AI 模型與 Veo 視頻生成模型進(jìn)行融合,以此提升 Gemini 對(duì)物理世界的理解能力。

Hassabis 表示:“我們從一開始就將 Gemini 這一基礎(chǔ)模型打造為多模態(tài)模型,因?yàn)槲覀冇兄鴺?gòu)建一個(gè)通用數(shù)字助手的愿景,這個(gè)助手能夠在現(xiàn)實(shí)世界中真正為你提供幫助?!?/p>

目前,整個(gè) AI 行業(yè)正逐漸朝著“全能”模型的方向發(fā)展,這些模型能夠理解和整合多種媒體形式。谷歌最新的 Gemini 模型不僅可以生成圖像和文本,還能生成音頻;而 OpenAI 在 ChatGPT 中的默認(rèn)模型如今也能創(chuàng)建圖像,包括宮崎駿風(fēng)格的藝術(shù)作品。亞馬遜也宣布計(jì)劃在今年晚些時(shí)候推出一款“任意到任意”的模型。

據(jù)IT之家了解,這些“全能”模型需要大量的訓(xùn)練數(shù)據(jù),包括圖像、視頻、音頻、文本等。Hassabis 暗示,Veo 的視頻數(shù)據(jù)主要來源于谷歌旗下的 YouTube 平臺(tái)。他說道:“通過觀看大量的 YouTube 視頻,Veo 2 能夠了解世界的物理規(guī)律?!贝饲?,谷歌曾向 TechCrunch 表示,其模型可能會(huì)根據(jù)與 YouTube 創(chuàng)作者達(dá)成的協(xié)議,使用“部分”YouTube 內(nèi)容進(jìn)行訓(xùn)練。據(jù)報(bào)道,該公司去年擴(kuò)大了服務(wù)條款的部分內(nèi)容,以便獲取更多數(shù)據(jù)來訓(xùn)練其 AI 模型。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Gemini,Veo,谷歌
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知