摩爾線(xiàn)程開(kāi)源音頻理解大模型 MooER：基于國(guó)產(chǎn)全功能 GPU 訓(xùn)練和推理

2024/8/23 18:21:35 來(lái)源：IT之家作者：沛霖（實(shí)習(xí)） 責(zé)編：沛霖

評(píng)論：

IT之家 8 月 23 日消息，摩爾線(xiàn)程開(kāi)源了音頻理解大模型 —MooER（摩耳），是業(yè)界首個(gè)基于國(guó)產(chǎn)全功能 GPU 進(jìn)行訓(xùn)練和推理的大型開(kāi)源語(yǔ)音模型。

基于摩爾線(xiàn)程夸娥（KUAE）智算平臺(tái)，MooER 大模型用 38 小時(shí)完成了 5000 小時(shí)音頻數(shù)據(jù)和偽標(biāo)簽的訓(xùn)練。

MooER 不僅支持中文和英文的語(yǔ)音識(shí)別，還具備中譯英的語(yǔ)音翻譯能力。在 Covost2 中譯英測(cè)試集中，MooER-5K 取得了 25.2 的 BLEU 分?jǐn)?shù)，接近工業(yè)級(jí)效果。

摩爾線(xiàn)程 AI 團(tuán)隊(duì)在該工作中開(kāi)源了推理代碼和 5000 小時(shí)數(shù)據(jù)訓(xùn)練的模型，并計(jì)劃進(jìn)一步開(kāi)源訓(xùn)練代碼和基于 8 萬(wàn)小時(shí)數(shù)據(jù)訓(xùn)練的模型。

摩爾線(xiàn)程開(kāi)源音頻理解大模型 MooER：基于國(guó)產(chǎn)全功能 GPU 訓(xùn)練和推理

MooER 的模型結(jié)構(gòu)包括 Encoder、Adapter 和 Decoder（Large Language Model，LLM）三個(gè)部分，具體的模型參數(shù)規(guī)模如下：

摩爾線(xiàn)程開(kāi)源音頻理解大模型 MooER：基于國(guó)產(chǎn)全功能 GPU 訓(xùn)練和推理

IT之家附相關(guān)鏈接：

Github 地址：https://github.com/MooreThreads/MooER
技術(shù)文檔：https://arxiv.org/pdf/2408.05101
技術(shù)演示：https://mooer-speech.mthreads.com:10077/

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

摩爾線(xiàn)程開(kāi)源音頻理解大模型 MooER：基于國(guó)產(chǎn)全功能 GPU 訓(xùn)練和推理

相關(guān)文章