阿里通義千問開源 Qwen2-Audio 7B 語(yǔ)音交互大模型：自由互動(dòng)，無需輸入文本

2024/8/13 12:07:20 來源：IT之家作者：沛霖（實(shí)習(xí)） 責(zé)編：沛霖

評(píng)論：

感謝IT之家網(wǎng)友我搶了臺(tái)、風(fēng)見暉一的線索投遞！

IT之家 8 月 13 日消息，阿里通義千問開源 Qwen2-Audio 系列的兩個(gè)模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作為一個(gè)大規(guī)模音頻語(yǔ)言模型，Qwen2-Audio 能夠接受各種音頻信號(hào)輸入，并根據(jù)語(yǔ)音指令執(zhí)行音頻分析或直接響應(yīng)文本，有兩種不同的音頻交互模式：

官方在一系列基準(zhǔn)數(shù)據(jù)集上進(jìn)行了測(cè)試，Qwen2-Audio 超越了先前的最佳模型。

阿里通義千問開源 Qwen2-Audio 7B 語(yǔ)音交互大模型：自由互動(dòng)，無需輸入文本

▲ Qwen2-Audio 整體表現(xiàn)

IT之家附相關(guān)鏈接如下：

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

阿里通義千問開源 Qwen2-Audio 7B 語(yǔ)音交互大模型：自由互動(dòng)，無需輸入文本