設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

中國(guó)首個(gè) Sora 級(jí)模型 Vidu 發(fā)布:可生成最長(zhǎng) 16 秒、最高 1080P 視頻

2024/4/27 13:17:17 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵
感謝IT之家網(wǎng)友 Hi_World 的線索投遞!

IT之家 4 月 27 日消息,生數(shù)科技今天出席中關(guān)村論壇未來(lái)人工智能先鋒論壇,攜手清華大學(xué)正式發(fā)布中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型 ——Vidu,被媒體和業(yè)內(nèi)人士認(rèn)為是國(guó)內(nèi)首個(gè) Sora 級(jí)別的視頻大模型。

根據(jù)官方描述,Vidu 模型融合 Diffusion 與 Transformer,開(kāi)創(chuàng)性創(chuàng)建了 U-ViT,支持一鍵生成長(zhǎng)達(dá) 16 秒、分辨率高達(dá) 1080P 的高清視頻內(nèi)容。

官方宣傳資料中演示了“畫(huà)室中的一艘船駛向鏡頭”、其海浪、船的效果非常逼真。

官方表示 Vidu 不僅能夠模擬真實(shí)物理世界,還擁有豐富想象力,具備多鏡頭生成、時(shí)空一致性高等特點(diǎn)。

Vidu 是自 Sora 發(fā)布之后,全球率先取得重大突破的視頻大模型,性能全面對(duì)標(biāo)國(guó)際頂尖水平,并在加速迭代提升中。

Vidu 的快速突破源自于團(tuán)隊(duì)在貝葉斯機(jī)器學(xué)習(xí)和多模態(tài)大模型的長(zhǎng)期積累和多項(xiàng)原創(chuàng)性成果。

其核心技術(shù) U-ViT 架構(gòu)由團(tuán)隊(duì)于 2022 年 9 月提出,早于 Sora 采用的 DiT 架構(gòu),是全球首個(gè) Diffusion 與 Transformer 融合的架構(gòu)。

2023 年 3 月,團(tuán)隊(duì)開(kāi)源了全球首個(gè)基于 U-ViT 融合架構(gòu)的多模態(tài)擴(kuò)散模型 UniDiffuser,率先完成了 U-ViT 架構(gòu)的大規(guī)??蓴U(kuò)展性驗(yàn)證。

IT之家附上參考地址

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AIVidu清華

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知