AI新應(yīng)用，斯坦福新研究為視頻人物隨意換口型

2019/6/10 17:37:54 來源：獵云網(wǎng) 作者：胖虎責(zé)編：懶貓

評論：

在電視和電影的拍攝中，演員在表演中經(jīng)常會不小心犯下一些小錯誤。對于影片的剪輯師而言，如果不想要花費巨資重新拍攝，那么就只能接受這些瑕疵。

那么我們可以想象一下，剪輯師是否能通過文字劇本來重新修改視頻。這個過程簡單地就像平時處理word文檔那樣，添加你想要的內(nèi)容，刪除多余的內(nèi)容，甚至完全重新排列拍攝的影片，讓它看起來就像一個全新的視頻那樣，毫無瑕疵。

一批來自斯坦福大學(xué)、馬克斯普朗克信息學(xué)研究所、普林斯頓大學(xué)和Adobe Research的研究人員組織了一個團隊，他們創(chuàng)建了一種算法，它能編輯頭部特寫的對話視頻——即視頻中的講話人主要出現(xiàn)肩膀以上的部分。

對于視頻剪輯師和發(fā)行商而言，這個研究成果會非常有用。但也有人擔(dān)心這種工具會影響網(wǎng)上視頻和圖片的可信性。研究人員也針對這些工具提出了一些使用準(zhǔn)則，提示觀看者這些視頻受到過修改。

“不幸的是，這種技術(shù)永遠會招來不法分子的注意。盡管如此，它能帶來更多創(chuàng)造性的視頻編輯和內(nèi)容創(chuàng)作應(yīng)用，因此也是值得的?！彼固垢４髮W(xué)博士后Ohad Fried說道。

這種應(yīng)用通過全新的腳本從各種視頻片段中提取講話時的唇部動作，并采用機器學(xué)習(xí)將它“移植”到目標(biāo)視頻中，讓觀眾看起來更自然。換句話說，它就是讓“唇部運動”和文本同步。

“從表面上看，這些視頻非常完美，它不再需要重新錄制?！盕ried說道，他以第一作者的身份發(fā)表了一篇相關(guān)研究的論文，目前該論文已經(jīng)上傳至論文預(yù)印本網(wǎng)站arXiv上。該項目始于兩年前，當(dāng)時Fried還只是普林斯頓大學(xué)計算機科學(xué)家Adam Finkelstein手下的一名研究生。

一旦演員在表演時講錯了臺詞，剪輯師只需要重新修改一下劇本臺詞，這個應(yīng)用會自動找到視頻中對應(yīng)的片段，并搜索該視頻中其他的臺詞，重新組裝這段語音。換句話說，這就是在重寫視頻的臺詞，就像我們修改文檔中拼錯的單詞那樣。該算法需要原始視頻為素材，修改時間約為40分鐘。

在此之后，這個算法會從其他視頻中尋找人物講話時的嘴部動作，生成新的視頻。

為了讓視頻看起來更加自然，該算法還能讓運動參數(shù)的變化更加平滑，并進行3D動畫渲染。最后，它會通過一種名為Neural Rendering的機器學(xué)習(xí)技術(shù)提高視頻的仿真度。

在138位參與者的測試里，該團隊的編輯結(jié)果中有60%被評為“逼真”。也就是說加工后的視頻和原始視頻非常像，但Fried表示還有很大的提升空間。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

AI新應(yīng)用，斯坦福新研究為視頻人物隨意換口型

相關(guān)文章

AI新應(yīng)用，斯坦福新研究為視頻人物隨意換口型