微軟智能語(yǔ)音新增 5 個(gè)角色 “飆演技”

2020/12/11 18:01:17 來(lái)源：IT之家作者：玄隱責(zé)編：玄隱

評(píng)論：

IT之家12月11日消息近期，微軟智能語(yǔ)音實(shí)現(xiàn)技術(shù)升級(jí)，一次性新增了 5 個(gè)聲音角色供用戶自由選擇，覆蓋男女聲和不同年齡段，以及不同性格和聲線特征，包括陽(yáng)光活潑的男青年（云希）和獨(dú)立自信的女青年（曉萱），溫柔大方的女中青年（曉涵）和多才多藝的女青年（曉墨），以及成熟睿智的女中老年（曉睿）。另外，中年男聲（云野）也同步更新了多種聲音風(fēng)格。他們與此前多個(gè)聲音角色一起，共同組成了微軟豐富的中文智能語(yǔ)音 “家族”。

下面是新增以及更新角色聲音 demo：

類似人類主播在播講一個(gè)有聲小說時(shí)會(huì)模擬不同的角色，微軟最新的智能語(yǔ)音也支持聲線變換，一人模擬多個(gè)角色，比如女生扮演男生，年輕人扮演老人的聲音，做到 “聲隨境轉(zhuǎn)”，大秀聲音 “演技”。同時(shí)，不同的聲線變化也包含多種情感變換，讓角色更加活靈活現(xiàn)。

正是基于這些豐富多樣且功能強(qiáng)大的聲音角色，用戶得以自由組合出豐富的音頻產(chǎn)品。

IT之家獲悉，這些新聲音在開發(fā)過程中采用了最新的遷移學(xué)習(xí)技術(shù)，僅利用少量表現(xiàn)力語(yǔ)料數(shù)據(jù)，便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語(yǔ)音生成能力的源模型。該源模型通過對(duì)人類語(yǔ)音表現(xiàn)力特征的深入挖掘，獲取了穩(wěn)定性高，適應(yīng)性強(qiáng)的語(yǔ)音情感表征，極大地豐富了合成語(yǔ)音的表現(xiàn)力與可控性。微軟還進(jìn)一步構(gòu)建了基于角色和風(fēng)格變換的隱式表達(dá)空間，可以靈活地將多個(gè)不同的角色和風(fēng)格適應(yīng)到一個(gè)新的表現(xiàn)力豐富的說話人模型。

目前，微軟語(yǔ)音合成多角色可應(yīng)用在有聲書、兒童故事、新聞串講等多種場(chǎng)景，滿足不同的產(chǎn)品矩陣。

對(duì)于音頻內(nèi)容產(chǎn)業(yè)而言，微軟此次語(yǔ)音合成多角色技術(shù)更新不僅令聲音風(fēng)格更為多樣且具有感染力，也將進(jìn)一步降低音頻內(nèi)容生產(chǎn)成本、提高制作速度和質(zhì)量。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

微軟智能語(yǔ)音新增 5 個(gè)角色 “飆演技”

相關(guān)文章