IT之家4月14日消息 企查查 App 顯示,4 月 13 日,科大訊飛(002230)公開了一項名為 “一種方言語音轉(zhuǎn)換方法、裝置、設(shè)備及存儲介質(zhì)”的專利,申請日期 2020 年 12 月,公開號 CN112652309A。企查查專利摘要顯示,本申請?zhí)峁┑姆窖哉Z音轉(zhuǎn)換方法可將目標(biāo)說話人的源方言語音轉(zhuǎn)換為符合目標(biāo)說話人的說話特色的目標(biāo)方言語音。
根據(jù)專利申請書的內(nèi)容,中國地域廣闊,漢語的方言眾多,漢族社會在發(fā)展過程中出現(xiàn)過程度不同的分化和統(tǒng)一,因而使?jié)h語逐漸產(chǎn)生了方言。隨著人口流動性增大,語言不通導(dǎo)致交流障礙是一個亟待解決的問題。該專利首先獲取目標(biāo)說話人的源方言語音,然后將所述源方言語音轉(zhuǎn)換為目標(biāo)方言文本,并從所述源方言語音中提取所述目標(biāo)說話人的說話人信息。最后,根據(jù)所述目標(biāo)方言文本和所述目標(biāo)說話人的說話人信息,合成符合所述目標(biāo)說話人的說話特色的目標(biāo)方言語音。
IT之家了解到,科大訊飛這種方法使用預(yù)先建立的語音合成模型,模型的訓(xùn)練目標(biāo)還包括:使所述對抗生成網(wǎng)絡(luò)中的判別網(wǎng)絡(luò)無法判別所述源方言訓(xùn)練語音對應(yīng)的目標(biāo)語言合成語音是合成語音還是真實語音。
該專利還詳細(xì)介紹了方言訓(xùn)練模型的建立方法。官方表示,由于目標(biāo)方言語音以目標(biāo)說話人的說話人信息為依據(jù)合成,因此合成的目標(biāo)方言語音具有目標(biāo)說話人的說話特色。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。