IT之家 5 月 23 日消息,Meta 公司推出了 Massively Multilingual Speech(MMS)項(xiàng)目,為 1100 多種語(yǔ)言提供了先進(jìn)的語(yǔ)言轉(zhuǎn)文本、文本轉(zhuǎn)語(yǔ)音服務(wù),且支持將近 4000 多種未標(biāo)記的口語(yǔ)。
Meta 為 MMS 項(xiàng)目整合了自我監(jiān)督學(xué)習(xí)工作 wav2vec 2.0 和一個(gè)新的數(shù)據(jù)集,通過(guò)實(shí)測(cè)發(fā)現(xiàn) MMS 優(yōu)于現(xiàn)有模型,且支持的語(yǔ)言數(shù)量是其 10 倍。
Meta 創(chuàng)造這項(xiàng)成就的關(guān)鍵在于引入了龐大的音頻數(shù)據(jù)集,其中包含 1100 多種新約圣經(jīng)(New Testament)的朗讀內(nèi)容。Meta 表示整合該音頻數(shù)據(jù)集之后所產(chǎn)生的語(yǔ)音模型在男性和女性聲音中表現(xiàn)同樣出色。
IT之家在此附上 Meta 的詳細(xì)原文報(bào)道,感興趣的用戶可以點(diǎn)擊閱讀。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。