IT之家 8 月 21 日消息,近日,快手自研的大語言模型“快意”(KwaiYii)已開啟內(nèi)測,并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn) API 和定制化項(xiàng)目合作方案。
在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同時(shí)位列 five-shot 和 zero-shot 下的第一名,在人文學(xué)科、中國特定主題等方面較強(qiáng),平均分超 61 分。
IT之家查詢快意 GitHub 頁面發(fā)現(xiàn),官方介紹顯示:
快意大模型(KwaiYii) 是由快手 AI 團(tuán)隊(duì)從零到一獨(dú)立自主研發(fā)的一系列大規(guī)模語言模型(Large Language Model,LLM),當(dāng)前包含了多種參數(shù)規(guī)模的模型,并覆蓋了預(yù)訓(xùn)練模型(KwaiYii-Base)、對(duì)話模型(KwaiYii-Chat)。這里面我們介紹 13B 規(guī)模的系列模型 KwaiYii-13B,其主要特點(diǎn)包括:
KwaiYii-13B-Base 預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在絕大部分權(quán)威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 預(yù)訓(xùn)練模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規(guī)模的領(lǐng)先水平。
KwaiYii-13B-Chat 對(duì)話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明 KwaiYii-13B-Chat 超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近 ChatGPT(3.5)同等水平。
據(jù)了解,快手 AI 團(tuán)隊(duì)將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力 ,另一方面也在推進(jìn)更多 C 端與 B 端業(yè)務(wù)場景下的落地。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。