IT之家 6 月 28 日消息,Hugging Face 聯(lián)合創(chuàng)始人兼首席執(zhí)行 Clem Delangue 于 6 月 26 日在 X 平臺發(fā)布推文,表示阿里云開源的通義千問(Qwen)指令微調(diào)模型 Qwen2-72B 在開源模型排行榜上榮登榜首。
Hugging Face 公布了全新的開源大語言模型排行榜,通過 300 片英偉達(dá) H100 GPU,重新運(yùn)行 MMLU-pro 等標(biāo)準(zhǔn)評估目前主流的大語言模型,并在其要點(diǎn)介紹中稱 Qwen2-72B 為“王者”,并表示中國的諸多開源模型在榜單上有一席之位。
他表示,為了提供全新的開源大模型排行榜,使用了 300 塊 H100 對目前全球 100 多個主流開源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基準(zhǔn)測試集上進(jìn)行了全新評估。
阿里巴巴開源的 Qwen-2 72B 模型在激烈競爭中脫穎而出,不僅超越了科技巨頭 Meta 的 Llama-3,還超越了法國知名大模型平臺 Mistralai 的 Mixtral,成為了新的行業(yè)領(lǐng)軍者。IT之家援引官方博文附上榜單排行如下:
排名 | 新的榜單排名 |
---|---|
? | Qwen/Qwen2-72B-Instruct |
2 | meta-llama/Meta-Llama-3-70B-Instruct |
3 | microsoft/Phi-3-medium-4k-instruct |
4 | 01-ai/Yi-1.5-34B-Chat |
5 | CohereForAI/c4ai-command-r-plus |
6 | abacusai/Smaug-72B-v0.1 |
7 | Qwen/Qwen1.5-110B |
8 | Qwen/Qwen1.5-110B-Chat |
9 | microsoft/Phi-3-small-128k-instruct |
10 | 01-ai/Yi-1.5-9B-Chat |
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。