IT之家 8 月 23 日消息,微軟 Azure AI 語(yǔ)音服務(wù)允許開(kāi)發(fā)者構(gòu)建多語(yǔ)言生成式 AI 語(yǔ)音應(yīng)用,Azure AI 語(yǔ)音服務(wù)最新推出了文本到語(yǔ)音虛擬人功能,可以將簡(jiǎn)單的文本轉(zhuǎn)換為人類(lèi)自然說(shuō)話(huà)視頻。
今天,微軟宣布全面推出 Text to Speech Avatar 功能。這項(xiàng)新功能使開(kāi)發(fā)者能夠?yàn)槠溆脩?hù)創(chuàng)建個(gè)性化虛擬人。該服務(wù)的輸出視頻分辨率為 1920 x 1080,每秒 25 幀。IT之家附示例如下:
Text to Speech Avatar 具有以下功能:
將文本轉(zhuǎn)換為由 Azure AI 文本轉(zhuǎn)語(yǔ)音提供支持的人類(lèi)說(shuō)話(huà)視頻,該視頻具有自然的聲音。
提供不同的人物預(yù)設(shè)形象。
形象的聲音由 Azure AI 文本轉(zhuǎn)語(yǔ)音生成。
使用批量合成 API 異步或?qū)崟r(shí)合成文本到語(yǔ)音人像視頻。
在 Speech Studio 中提供內(nèi)容創(chuàng)建工具,無(wú)需編碼即可創(chuàng)建視頻內(nèi)容。
通過(guò) Speech Studio 中的實(shí)時(shí)聊天頭像工具啟用實(shí)時(shí)人像對(duì)話(huà)。
定價(jià)方面,文本轉(zhuǎn)視頻服務(wù)的收費(fèi)將根據(jù)視頻輸出的長(zhǎng)度計(jì)算并按秒收費(fèi)。該服務(wù)現(xiàn)已在東南亞、北歐、西歐、瑞典中部、美國(guó)中南部和美國(guó)西部地區(qū)推出。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。