設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

開源 AI 大模型“洗牌”:阿里通義千問 Qwen2-72B 成“王者”,傲視 Meta Llama-3、微軟 Phi-3 等群雄

2024/6/28 7:49:17 來源:IT之家 作者:故淵 責(zé)編:故淵
感謝IT之家網(wǎng)友 風(fēng)見暉一、仙人掌 的線索投遞!

IT之家 6 月 28 日消息,Hugging Face 聯(lián)合創(chuàng)始人兼首席執(zhí)行 Clem Delangue 于 6 月 26 日在 X 平臺發(fā)布推文,表示阿里云開源的通義千問(Qwen)指令微調(diào)模型 Qwen2-72B 在開源模型排行榜上榮登榜首。

Hugging Face 公布了全新的開源大語言模型排行榜,通過 300 片英偉達(dá) H100 GPU,重新運(yùn)行 MMLU-pro 等標(biāo)準(zhǔn)評估目前主流的大語言模型,并在其要點(diǎn)介紹中稱 Qwen2-72B 為“王者”,并表示中國的諸多開源模型在榜單上有一席之位。

他表示,為了提供全新的開源大模型排行榜,使用了 300 塊 H100 對目前全球 100 多個主流開源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基準(zhǔn)測試集上進(jìn)行了全新評估。

阿里巴巴開源的 Qwen-2 72B 模型在激烈競爭中脫穎而出,不僅超越了科技巨頭 Meta 的 Llama-3,還超越了法國知名大模型平臺 Mistralai 的 Mixtral,成為了新的行業(yè)領(lǐng)軍者。IT之家援引官方博文附上榜單排行如下:

排名新的榜單排名
?Qwen/Qwen2-72B-Instruct
2meta-llama/Meta-Llama-3-70B-Instruct
3microsoft/Phi-3-medium-4k-instruct
401-ai/Yi-1.5-34B-Chat
5CohereForAI/c4ai-command-r-plus
6abacusai/Smaug-72B-v0.1
7Qwen/Qwen1.5-110B
8Qwen/Qwen1.5-110B-Chat
9microsoft/Phi-3-small-128k-instruct
1001-ai/Yi-1.5-9B-Chat

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:阿里,Qwen,AI大語言模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知