你敢信,派大星當(dāng)眾宣稱自己是鋼鐵俠,漫威宇宙和比基尼海灘夢(mèng)幻聯(lián)動(dòng):
I am Iron Man!
這深沉憨厚又有點(diǎn)喜感的嗓音,是派大星本星沒(méi)錯(cuò)了。
而小扎也瘋狂亂入,直接搶了派大星的臺(tái)詞,喊海綿寶寶去抓水母:
hi,spongebob,shall we go to catch jellyfishes?
沒(méi)錯(cuò),這又是 AI 的杰作。
這個(gè)名叫 FakeYou 的語(yǔ)音偽造模型,最近火爆到服務(wù)器都被擠掛掉了。
像這位網(wǎng)友一樣給馬男波杰克寫(xiě)段臺(tái)詞:
suck a *. why are you still here?! did you eat my muffin? you are a worthless piece of no good shit who deserves to die. what are YOUU doing here? what are you doing here.
一鍵就可以還原他“致郁”的聲音。
這“What are youuuu doing”的發(fā)音,確實(shí)夠傳神了。
目前上傳的人物語(yǔ)音模型已經(jīng)有很多,包括海綿寶寶、摩根?弗里曼、辛普森一家、馬男波杰克、滅霸等等。
demo 在線可玩,快來(lái)試試~
操作也很簡(jiǎn)單,只需兩步:
在圖中第一個(gè)紅框中的下拉菜單中選擇你喜歡的人物,然后在下面的文本框中輸入你希望 TA 說(shuō)的話,再點(diǎn)擊“Speak”就 ok 了。
另外,如果你還想讓 TA 對(duì)上口型,F(xiàn)akeYou 也在線提供了相關(guān)功能。選擇不同的視頻 model,上傳音頻文件就可以了。
FakeYou 如何 Fake
那 FakeYou 是怎么實(shí)現(xiàn)文本轉(zhuǎn)語(yǔ)音和對(duì)口型的呢?
對(duì)于文本轉(zhuǎn)語(yǔ)音的任務(wù),F(xiàn)akeYou 提到了一系列的模型,主要是其中值得一提的是 MelGAN。
它的整體結(jié)構(gòu)也比較簡(jiǎn)單,工作流是這樣的:
首先將輸入的文本轉(zhuǎn)化為梅爾聲譜圖,然后再利用 GAN 去學(xué)習(xí)圖中的特征,提取聲音的信息。
最后再通過(guò)傅里葉逆變換還原出原始聲波。
而對(duì)口型任務(wù)使用的則是 Wav2Lip 模型,與之前的對(duì)口型模型的區(qū)別在于,Wav2Lip 使用預(yù)訓(xùn)練的判別器,在檢測(cè)唇同步時(shí)已經(jīng)相當(dāng)準(zhǔn)確。
并將口型的真值和遮住口型的部分輸入網(wǎng)絡(luò),用殘差網(wǎng)絡(luò)相連。
同時(shí)還使用了視覺(jué)判別器來(lái)提高視覺(jué)質(zhì)量和同步精度,進(jìn)一步提高模型質(zhì)量。
FakeYou 創(chuàng)作者
FakeYou 的創(chuàng)作者主要是畢業(yè)于南方理工州立大學(xué) Brandon Thomas,他是一名來(lái)自亞特蘭大的工程師。
自這款 demo 改名為 FakeYou 之后,就受到很多網(wǎng)友的喜愛(ài)。因此有很多社區(qū)中的網(wǎng)友也來(lái)貢獻(xiàn)“聲音”。目前 FakeYou 中已經(jīng)有幾百個(gè)用于制作的語(yǔ)音模型。
如果沒(méi)能找到合適的人物語(yǔ)音模型,也可以自己添加,來(lái)豐富 FakeYou。
如果你也有想讓影視或者動(dòng)漫中的人物說(shuō)出你想聽(tīng)的話,可以參考文末的在線 demo 鏈接。
參考鏈接:
[1]https://fakeyou.com/
[2]https://arxiv.org/abs/1910.06711
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。