設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

索尼公布最新黑科技“AI 聲音分離技術(shù)”

2021/7/26 21:07:31 來源:IT之家 作者:信鴿 責(zé)編:信鴿

IT之家 7 月 26 日消息 索尼公司今日發(fā)布文章,介紹了索尼的一項(xiàng)“黑科技”創(chuàng)新成果 ——AI 聲音分離技術(shù)。這項(xiàng)技術(shù)可以從混合的音源中提取出單個(gè)的聲音。由于聲音信號僅有兩個(gè)維度,傳統(tǒng)技術(shù)對聲音進(jìn)行分離十分困難,但是在 2013 年,索尼引入 AI 人工智能技術(shù),在這個(gè)領(lǐng)域更進(jìn)一步。

目前,這項(xiàng)技術(shù)在復(fù)原經(jīng)典電影、消除智能手機(jī)的噪音、實(shí)現(xiàn)音樂流媒體服務(wù)的實(shí)時(shí)卡拉 OK 功能等方面已經(jīng)取得了成果,未來還將應(yīng)用到更多領(lǐng)域。

索尼研發(fā)人員光藤祐基在接受采訪時(shí)表示:AI 聲音分離技術(shù)可以從音頻數(shù)據(jù)中去除不必要的噪音,只提取人聲或其他特定樂器的聲音。當(dāng)人類在聆聽一場多種聲音混合在一起的表演時(shí),可以分辨出各個(gè)樂器,或者在進(jìn)行對話時(shí),即使被一大群人包圍,我們也能自然而然地專注于一個(gè)聲音。這些都是人類獨(dú)有的能力,而直到近來,計(jì)算機(jī)要做到這一點(diǎn)都還是極其困難的。有人將這項(xiàng)任務(wù)描述為混合兩種果汁,之后提取其中一種。但是在過去的幾年里,由于 AI 新方法的引入,這項(xiàng)技術(shù)有了極大的提升。

光藤祐基表示,聲音分離是由 AI 進(jìn)行的,而人們可以教計(jì)算機(jī)來完成這個(gè)任務(wù)。一把吉他有一個(gè)特定的聲音或頻率,這一點(diǎn)可被神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到。無論混合了多少種聲音,我們的 AI 系統(tǒng)都能夠識別這些特征。

另一名索尼的研發(fā)人員尤里奇表示,神經(jīng)網(wǎng)絡(luò)在所謂的訓(xùn)練中能夠?qū)W習(xí)識別音頻特征。在這個(gè)訓(xùn)練中,神經(jīng)網(wǎng)絡(luò)會看到很多音樂--比我們一生中聽到的音樂還要多--以及我們應(yīng)該提取的目標(biāo)聲音。這些信息足以讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)聲音分離。

IT之家了解到,很多經(jīng)典電影的對白和音效在同一個(gè)音軌上,要想進(jìn)行優(yōu)化,需要從中提取人聲。索尼的 AI 系統(tǒng)能夠成功地從母版中提取單個(gè)音效,《阿拉伯的勞倫斯》和《甘地》兩步電影的 4K 重制超清版本中,索尼影視娛樂公司的調(diào)音師用這項(xiàng)技術(shù)提取出聲音,用杜比全景聲進(jìn)行重制,創(chuàng)造了一個(gè)沉浸式的聲場。

據(jù)IT之家了解,索尼 AI 聲音分離技術(shù)還能夠應(yīng)用于電影之外的場景,比如清理通過麥克風(fēng)記錄的人類聲音。索尼的自主型娛樂機(jī)器人“小狗”aibo 可以利用該技術(shù),更好地識別人聲,去除背景噪聲,以提高語音識別能力。對用戶而言最實(shí)際的應(yīng)用,是利用聲音分離技術(shù),將歌曲中的原唱分離出去,制作成卡拉 OK 伴奏。

光藤祐基還表示,希望技術(shù)能夠像一臺時(shí)光機(jī)一樣,讓過去和現(xiàn)在的藝術(shù)家能夠跨時(shí)空合作。索尼 PCL 和索尼音樂解決方案剛剛開始使用我們的技術(shù)對外提供服務(wù),所以肯定會有更多的應(yīng)用,非常期待未來的前景。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知