IT之家12月11日消息 近期,微軟智能語音實現(xiàn)技術(shù)升級,一次性新增了 5 個聲音角色供用戶自由選擇,覆蓋男女聲和不同年齡段,以及不同性格和聲線特征,包括陽光活潑的男青年(云希)和獨立自信的女青年(曉萱),溫柔大方的女中青年(曉涵)和多才多藝的女青年(曉墨),以及成熟睿智的女中老年(曉睿)。另外,中年男聲(云野)也同步更新了多種聲音風(fēng)格。他們與此前多個聲音角色一起,共同組成了微軟豐富的中文智能語音 “家族”。
下面是新增以及更新角色聲音 demo:
類似人類主播在播講一個有聲小說時會模擬不同的角色,微軟最新的智能語音也支持聲線變換,一人模擬多個角色,比如女生扮演男生,年輕人扮演老人的聲音,做到 “聲隨境轉(zhuǎn)”,大秀聲音 “演技”。同時,不同的聲線變化也包含多種情感變換,讓角色更加活靈活現(xiàn)。
正是基于這些豐富多樣且功能強(qiáng)大的聲音角色,用戶得以自由組合出豐富的音頻產(chǎn)品。
IT之家獲悉,這些新聲音在開發(fā)過程中采用了最新的遷移學(xué)習(xí)技術(shù),僅利用少量表現(xiàn)力語料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語音生成能力的源模型。該源模型通過對人類語音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語音情感表征,極大地豐富了合成語音的表現(xiàn)力與可控性。微軟還進(jìn)一步構(gòu)建了基于角色和風(fēng)格變換的隱式表達(dá)空間,可以靈活地將多個不同的角色和風(fēng)格適應(yīng)到一個新的表現(xiàn)力豐富的說話人模型。
目前,微軟語音合成多角色可應(yīng)用在有聲書、兒童故事、新聞串講等多種場景,滿足不同的產(chǎn)品矩陣。
對于音頻內(nèi)容產(chǎn)業(yè)而言,微軟此次語音合成多角色技術(shù)更新不僅令聲音風(fēng)格更為多樣且具有感染力,也將進(jìn)一步降低音頻內(nèi)容生產(chǎn)成本、提高制作速度和質(zhì)量。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。