IT之家 4 月 4 日消息,Stability AI 近日發(fā)布新聞稿,宣布推出 Stable Audio2.0,可以基于用戶輸入的提示詞,生成最長 3 分鐘的完整音軌。
Stable Audio 2.0 在此前 1.0 版本基礎(chǔ)上,進(jìn)一步為音頻生成擴(kuò)展了前奏、副歌、收尾和立體聲效果等內(nèi)容,最長可以生成 3 分鐘的音頻內(nèi)容。
Stable Audio 2.0 擴(kuò)充了生成功能之外,還提供了音頻生成音頻功能,基于用戶上傳的一小段音頻內(nèi)容,擴(kuò)展生成、補(bǔ)充相關(guān)的音頻內(nèi)容。IT之家附上演示視頻如下:
例如音樂家如果在創(chuàng)作某段音樂的時(shí)候“卡殼”了,可以上傳某段 DEMO,要求 Stable Audio 2.0 補(bǔ)充完整歌曲,讓你的各種小創(chuàng)意都能轉(zhuǎn)換為完整的音頻內(nèi)容。
Stable Audio 2.0 還支持定制、微調(diào)生成后的音頻內(nèi)容,換句話說,如果你不喜歡音頻中的某些內(nèi)容,你可以根據(jù)自己的具體需求改變風(fēng)格。
Stability Audio 2.0 不僅能生成完整的音軌,還能幫助您制作各種聲音和音頻效果,從打字時(shí)發(fā)出的聲音到人群背景聲等等。
相關(guān)閱讀:
《Stability AI 推出 Stable Audio,基于文本生成最長 90 秒音頻》
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。