設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
中国联通上线 iPhone eSIM 网站    华为 2024 年净利润 626 亿元

字節(jié)推出單圖視頻驅(qū)動(dòng)模型 X-Portrait 2:一鍵生成相同表情神態(tài),簡(jiǎn)化創(chuàng)作流程

2024/11/6 20:48:45 來(lái)源:IT之家 作者:沛霖(實(shí)習(xí)) 責(zé)編:沛霖

IT之家 11 月 6 日消息,單圖視頻驅(qū)動(dòng)技術(shù),即只需一張靜態(tài)照片和一段驅(qū)動(dòng)視頻,即可生成高質(zhì)量、“電影級(jí)”的視頻。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)推出最新單圖視頻驅(qū)動(dòng)技術(shù) X-Portrait 2,該模型不僅能保留原圖的 ID,還能捕捉并遷移從細(xì)微到夸張的表情和情緒,簡(jiǎn)化了現(xiàn)有動(dòng)作捕捉、角色動(dòng)畫(huà)和內(nèi)容創(chuàng)作流程。

▲ 左一圖為原圖、左一圖右下為驅(qū)動(dòng)視頻,左二圖為 X-Portrait 2 效果

不同于以往依賴人臉關(guān)鍵點(diǎn)檢測(cè)的單圖驅(qū)動(dòng)方法,X-Portrait 2 構(gòu)建了一個(gè)表情編碼器模型,通過(guò)一種端到端自監(jiān)督訓(xùn)練框架,能夠從大量人像視頻中自學(xué)習(xí) ID 無(wú)關(guān)的運(yùn)動(dòng)隱式表征。

▲ 左一為驅(qū)動(dòng)視頻截圖,其他為生產(chǎn)效果

進(jìn)一步將這個(gè)編碼器與強(qiáng)大的生成式擴(kuò)散模型相結(jié)合,即可生成流暢且富有表現(xiàn)力的視頻。經(jīng)過(guò)在大規(guī)模高質(zhì)量表情視頻上的訓(xùn)練,X-Portrait 2 在運(yùn)動(dòng)表現(xiàn)力和 ID 保持性方面顯著優(yōu)于先前技術(shù)。

IT之家附項(xiàng)目地址:https://byteaigc.github.io/X-Portrait2/

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:字節(jié)模型,XPortrait 2
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知