設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
中国联通上线 iPhone eSIM 网站    华为 2024 年净利润 626 亿元

國產(chǎn)文生視頻大模型 Vidu 發(fā)布 1.5 版本更新:可保證多不同視角下的一致性

2024/11/14 16:27:26 來源:IT之家 作者:清源 責編:清源
感謝IT之家網(wǎng)友 風見暉一 的線索投遞!

IT之家 11 月 14 日消息,國產(chǎn)文生視頻大模型廠商 Vidu 昨日宣布,Vidu 1.5 新版本正式上線,其實現(xiàn)了“世界領(lǐng)先水平”的突破 —— 能夠理解多樣化的輸入,突破“一致性”的難題。

Vidu 方面稱,其在上線之初就已具備角色一致性生成能力,通過鎖定人物面部特征可解決視頻生成的關(guān)鍵痛點,確保了人物面部特征的一致性。此次發(fā)布的更新中,Vidu 則首次展現(xiàn)了上下文學習的能力,提升了整體視頻模型的可控性,通過靈活的多元輸入實現(xiàn)了多角度、多主體、多元素的一致性生成。

IT之家獲悉,其在三個方面直觀呈現(xiàn)了“技術(shù)突破”:

  • 復雜主體的精準控制:無論是細節(jié)豐富的角色,還是復雜的物體,Vidu 都能保證其在多個不同視角下的一致性。如造型復雜的 3D 動畫風格角色,無論視角如何變化,其能夠始終確保頭型、服飾的全角度細節(jié)一致,避免了傳統(tǒng)視頻模型在復雜視角切換時產(chǎn)生的瑕疵。

  • 人物面部特征和動態(tài)表情的自然一致:在人物特寫鏡頭中,其能夠自然且流暢地保持人物面部特征和表情的連貫性,避免了面部僵硬或失真的現(xiàn)象。

  • 多主體一致性:用戶可上傳多個主題圖像,包括人物角色、道具物體、環(huán)境背景等,并在視頻生成中實現(xiàn)這些元素的交互。例如,用戶可以上傳主體、客體和環(huán)境的圖片,創(chuàng)建定制角色身穿特定服裝、在定制空間內(nèi)自由動作的場景。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Vidu,文生視頻
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知