IT之家 8 月 13 日消息,阿里通義千問開源 Qwen2-Audio 系列的兩個(gè)模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。
作為一個(gè)大規(guī)模音頻語(yǔ)言模型,Qwen2-Audio 能夠接受各種音頻信號(hào)輸入,并根據(jù)語(yǔ)音指令執(zhí)行音頻分析或直接響應(yīng)文本,有兩種不同的音頻交互模式:
語(yǔ)音聊天:用戶可以自由地與 Qwen2-Audio 進(jìn)行語(yǔ)音互動(dòng),而無需文本輸入
音頻分析:用戶可以在互動(dòng)過程中提供音頻和文本指令對(duì)音頻進(jìn)行分析
官方在一系列基準(zhǔn)數(shù)據(jù)集上進(jìn)行了測(cè)試,Qwen2-Audio 超越了先前的最佳模型。
IT之家附相關(guān)鏈接如下:
試用鏈接:https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
評(píng)估標(biāo)準(zhǔn):https://github.com/OFA-Sys/AIR-Bench
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。