快手自研大模型“快意（KwaiYii）”亮相，CMMLU 中文向排名第一

2023/8/21 9:04:50 來(lái)源：IT之家作者：汪淼責(zé)編：汪淼

評(píng)論：

IT之家 8 月 21 日消息，近日，快手自研的大語(yǔ)言模型“快意”（KwaiYii）已開(kāi)啟內(nèi)測(cè)，并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn) API 和定制化項(xiàng)目合作方案。

在最新的 CMMLU 中文向排名中，快意的 13B 版本 KwaiYii-13B 同時(shí)位列 five-shot 和 zero-shot 下的第一名，在人文學(xué)科、中國(guó)特定主題等方面較強(qiáng)，平均分超 61 分。

IT之家查詢(xún)快意 GitHub 頁(yè)面發(fā)現(xiàn)，官方介紹顯示：

快意大模型（KwaiYii）是由快手 AI 團(tuán)隊(duì)從零到一獨(dú)立自主研發(fā)的一系列大規(guī)模語(yǔ)言模型（Large Language Model，LLM），當(dāng)前包含了多種參數(shù)規(guī)模的模型，并覆蓋了預(yù)訓(xùn)練模型（KwaiYii-Base）、對(duì)話模型（KwaiYii-Chat）。這里面我們介紹 13B 規(guī)模的系列模型 KwaiYii-13B，其主要特點(diǎn)包括：
KwaiYii-13B-Base 預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力，在絕大部分權(quán)威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如，KwaiYii-13B-Base 預(yù)訓(xùn)練模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規(guī)模的領(lǐng)先水平。
KwaiYii-13B-Chat 對(duì)話模型具備出色的語(yǔ)言理解和生成能力，支持內(nèi)容創(chuàng)作、信息咨詢(xún)、數(shù)學(xué)邏輯、代碼編寫(xiě)、多輪對(duì)話等廣泛任務(wù)，人工評(píng)估結(jié)果表明 KwaiYii-13B-Chat 超過(guò)主流的開(kāi)源模型，并在內(nèi)容創(chuàng)作、信息咨詢(xún)和數(shù)學(xué)解題上接近 ChatGPT（3.5）同等水平。

快手自研大模型“快意（KwaiYii）”亮相，CMMLU 中文向排名第一

據(jù)了解，快手 AI 團(tuán)隊(duì)將持續(xù)迭代“快意”大模型，一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力，另一方面也在推進(jìn)更多 C 端與 B 端業(yè)務(wù)場(chǎng)景下的落地。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

快手自研大模型“快意（KwaiYii）”亮相，CMMLU 中文向排名第一

相關(guān)文章

快手自研大模型“快意（KwaiYii）”亮相，CMMLU 中文向排名第一