IT之家 12 月 1 日消息,阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio,目前已上線阿里魔搭社區(qū)。
本次開源的模型中除預(yù)訓(xùn)練模型外,還同步推出了對應(yīng)的對話模型,面向 72B、1.8B 對話模型提供了 4bit / 8bit 量化版模型,便于開發(fā)者們推理訓(xùn)練。
IT之家注:阿里云此前已經(jīng)開源了 70 億參數(shù)模型 Qwen-7B 以及 140 億參數(shù)模型 Qwen-14B。
據(jù)介紹,Qwen-72B 搭載了強(qiáng)大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制自己的 AI 助手,要求大模型扮演某個(gè)角色,或者執(zhí)行特定的回復(fù)任務(wù)。
官方表示,Qwen-72B 在 10 個(gè)權(quán)威基準(zhǔn)測評(píng)創(chuàng)下開源模型最優(yōu)成績,成為業(yè)界最強(qiáng)開源大模型,性能超越開源標(biāo)桿 Llama 2-70B 和大部分商用閉源模型。
未來,企業(yè)級(jí)、科研級(jí)的高性能應(yīng)用,也有了開源大模型這一選項(xiàng)。通義千問還開源了 18 億參數(shù)模型 Qwen-1.8B 和音頻大模型 Qwen-Audio。
至此,通義千問共開源 18 億、70 億、140 億、720 億參數(shù)的 4 款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)“全尺寸、全模態(tài)”開源。
IT之家附模型鏈接:
通義千問-72B-預(yù)訓(xùn)練:
https://modelscope.cn/models/qwen/Qwen-72B
通義千問-72B-Chat:
https://modelscope.cn/models/qwen/Qwen-72B-Chat
通義千問-72B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8
通義千問-72B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4
通義千問-1.8B-預(yù)訓(xùn)練:
https://modelscope.cn/models/qwen/Qwen-1_8B
通義千問-1.8B-Chat:
https://modelscope.cn/models/qwen/Qwen-1_8B-Chat
通義千問-1_8B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8
通義千問-1_8B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4
通義千問-Audio-預(yù)訓(xùn)練:
https://modelscope.cn/models/qwen/Qwen-Audio
通義千問-Audio-Chat:
https://modelscope.cn/models/qwen/Qwen-Audio-Chat
模型下載(以通義千問-72B-Chat-Int4 為例):
from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。