IT之家 9 月 13 日消息,小米公司今日發(fā)布消息,小米自研聲音識(shí)別算法在音頻標(biāo)記(Audio Tagging)任務(wù)中取得重要進(jìn)展。
據(jù)介紹,以公開(kāi)數(shù)據(jù)集 AudioSet-2M 的音頻數(shù)據(jù)作為訓(xùn)練集的音頻標(biāo)記模型,首次突破 50 mAP 的分?jǐn)?shù),此項(xiàng)突破標(biāo)志著小米聲音識(shí)別算法已在國(guó)際上性能排名第一。
小米公司表示:“未來(lái)我們將不斷探索科技新高度,在手機(jī)、音箱、手環(huán)、CyberDog 等豐富的設(shè)備使用場(chǎng)景中,給用戶帶來(lái)更高效更準(zhǔn)確的聲音識(shí)別體驗(yàn)?!?/p>
正如IT之家此前報(bào)道,小米目前在 AI 大模型方面也有發(fā)力,并結(jié)合小愛(ài)同學(xué)進(jìn)一步拓展用戶覆蓋范圍。結(jié)合聲音識(shí)別算法的進(jìn)步,小愛(ài)同學(xué)有望迎來(lái)更好的體驗(yàn)。
雷軍在此前的年度演講中透露稱,在 AI 方面,小米從 2016 年 7 月起就開(kāi)始布局,今年 4 月成立大模型團(tuán)隊(duì),相關(guān)團(tuán)隊(duì)超過(guò) 3000 人。小米 AI 大模型最新一個(gè) 13 億參數(shù)大模型已經(jīng)成功在手機(jī)本地跑通,部分場(chǎng)景可以媲美 60 億參數(shù)模型在云端運(yùn)行結(jié)果。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。