國產(chǎn)文生視頻大模型 Vidu 發(fā)布 1.5 版本更新：可保證多不同視角下的一致性

2024/11/14 16:27:26 來源：IT之家作者：清源責編：清源

評論：

感謝IT之家網(wǎng)友風見暉一的線索投遞！

IT之家 11 月 14 日消息，國產(chǎn)文生視頻大模型廠商 Vidu 昨日宣布，Vidu 1.5 新版本正式上線，其實現(xiàn)了“世界領(lǐng)先水平”的突破 —— 能夠理解多樣化的輸入，突破“一致性”的難題。

Vidu 方面稱，其在上線之初就已具備角色一致性生成能力，通過鎖定人物面部特征可解決視頻生成的關(guān)鍵痛點，確保了人物面部特征的一致性。此次發(fā)布的更新中，Vidu 則首次展現(xiàn)了上下文學習的能力，提升了整體視頻模型的可控性，通過靈活的多元輸入實現(xiàn)了多角度、多主體、多元素的一致性生成。

IT之家獲悉，其在三個方面直觀呈現(xiàn)了“技術(shù)突破”：

復雜主體的精準控制：無論是細節(jié)豐富的角色，還是復雜的物體，Vidu 都能保證其在多個不同視角下的一致性。如造型復雜的 3D 動畫風格角色，無論視角如何變化，其能夠始終確保頭型、服飾的全角度細節(jié)一致，避免了傳統(tǒng)視頻模型在復雜視角切換時產(chǎn)生的瑕疵。

人物面部特征和動態(tài)表情的自然一致：在人物特寫鏡頭中，其能夠自然且流暢地保持人物面部特征和表情的連貫性，避免了面部僵硬或失真的現(xiàn)象。
多主體一致性：用戶可上傳多個主題圖像，包括人物角色、道具物體、環(huán)境背景等，并在視頻生成中實現(xiàn)這些元素的交互。例如，用戶可以上傳主體、客體和環(huán)境的圖片，創(chuàng)建定制角色身穿特定服裝、在定制空間內(nèi)自由動作的場景。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

國產(chǎn)文生視頻大模型 Vidu 發(fā)布 1.5 版本更新：可保證多不同視角下的一致性

相關(guān)文章