IT之家 11 月 14 日消息,國產(chǎn)文生視頻大模型廠商 Vidu 昨日宣布,Vidu 1.5 新版本正式上線,其實現(xiàn)了“世界領(lǐng)先水平”的突破 —— 能夠理解多樣化的輸入,突破“一致性”的難題。
Vidu 方面稱,其在上線之初就已具備角色一致性生成能力,通過鎖定人物面部特征可解決視頻生成的關(guān)鍵痛點,確保了人物面部特征的一致性。此次發(fā)布的更新中,Vidu 則首次展現(xiàn)了上下文學習的能力,提升了整體視頻模型的可控性,通過靈活的多元輸入實現(xiàn)了多角度、多主體、多元素的一致性生成。
IT之家獲悉,其在三個方面直觀呈現(xiàn)了“技術(shù)突破”:
復雜主體的精準控制:無論是細節(jié)豐富的角色,還是復雜的物體,Vidu 都能保證其在多個不同視角下的一致性。如造型復雜的 3D 動畫風格角色,無論視角如何變化,其能夠始終確保頭型、服飾的全角度細節(jié)一致,避免了傳統(tǒng)視頻模型在復雜視角切換時產(chǎn)生的瑕疵。
人物面部特征和動態(tài)表情的自然一致:在人物特寫鏡頭中,其能夠自然且流暢地保持人物面部特征和表情的連貫性,避免了面部僵硬或失真的現(xiàn)象。
多主體一致性:用戶可上傳多個主題圖像,包括人物角色、道具物體、環(huán)境背景等,并在視頻生成中實現(xiàn)這些元素的交互。例如,用戶可以上傳主體、客體和環(huán)境的圖片,創(chuàng)建定制角色身穿特定服裝、在定制空間內(nèi)自由動作的場景。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。