IT之家 5 月 11 日消息,在 2023 I / O 開發(fā)者大會上,谷歌宣布正在開發(fā)一項名為 Universal Translator 的實驗技術(shù)。
顧名思義,該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調(diào)和氛圍。這意味著該技術(shù)不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和面部表情,人物說話視頻會根據(jù)目標語言的發(fā)音同步改變口型。
如上圖所示,Universal Translator 首先檢測單詞并進行翻譯。然后,它會檢查說話者的語氣以及他們強調(diào)的內(nèi)容。結(jié)合這兩個方面后,它會生成目標語言的語音。最后,它會根據(jù) AI 生成的語音的發(fā)音同步視頻中說話者的口型。
考慮到此工具可能被濫用來創(chuàng)建虛假視頻,谷歌表示將限制對 Universal Translator 的訪問。因此,只有谷歌授權(quán)合作伙伴才能將其用于建設性項目,而普通用戶無法使用。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。