IT之家3月4日消息 據(jù)微軟官方發(fā)布,近期,Azure 認(rèn)知服務(wù)中的語音服務(wù)的一部分——自定義神經(jīng)語音 (Custom Neural Voice)——文本到語音功能已普遍推出。該功能將允許用戶使用微軟開創(chuàng)性的神經(jīng)文本到語音模型,為應(yīng)用創(chuàng)建高度逼真、類似人類的自定義語音。由于創(chuàng)建的語音非常逼真,微軟限制了訪問權(quán)限,以便用戶負(fù)責(zé)任地使用這項技術(shù)。
微軟表示,
“作為微軟對負(fù)責(zé)任的人工智能承諾的一部分,我們設(shè)計和發(fā)布自定義神經(jīng)語音的目的是保護(hù)個人和社會的權(quán)利,促進(jìn)透明的人機(jī)交互,抵制有害的深層偽裝和誤導(dǎo)性內(nèi)容的擴(kuò)散。為此,我們對自定義神經(jīng)語音的訪問和使用進(jìn)行了限制。”
IT之家獲悉,要創(chuàng)建自定義語音,你只需錄制音頻并上傳作為訓(xùn)練數(shù)據(jù)即可。Azure 語音服務(wù)將為你的錄音創(chuàng)建一個獨特的語音調(diào)整。自定義神經(jīng)語音的聲音逼真自然,可以代表品牌,讓用戶以自然的方式與應(yīng)用進(jìn)行對話互動。
微軟強(qiáng)調(diào),以下客戶已經(jīng)在使用這項最新的 TTS 功能。
AT&T / 華納兄弟:他們最近在德克薩斯州達(dá)拉斯的 AT&T 體驗店推出了一個首創(chuàng)的創(chuàng)意和互動體驗,客戶可以直接與兔八哥對話。
Progressive:利用標(biāo)志性的 Progressive 保險發(fā)言人 Flo 的聲音,創(chuàng)建了 Flo 聊天機(jī)器人,以簡化客戶咨詢流程,提供個性化體驗。
Duolingo:為了讓學(xué)習(xí)一門新的語言感到可實現(xiàn)性和適用性,Duolingo 使用課程創(chuàng)建了多樣化的風(fēng)格化聲音。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。