【视频】快,不止一点,华为擎云 L420x 使用体验    特斯拉中国停供多款进口车

百川智能發(fā)布 Baichuan 2 開(kāi)源大模型,號(hào)稱(chēng)“文理兼?zhèn)淙骖I(lǐng)先 LLaMA 2”

2023/9/6 18:24:20 來(lái)源:IT之家 作者:汪淼 責(zé)編:汪淼

IT之家 9 月 6 日消息,百川智能今日召開(kāi)主題為“百川匯海,開(kāi)源共贏”的大模型發(fā)布會(huì),正式開(kāi)源微調(diào)后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 與其 4bit 量化版本,并且均為免費(fèi)可商用。

百川智能此次還開(kāi)源了模型訓(xùn)練的 Check Point,并宣布將發(fā)布 Baichuan 2 技術(shù)報(bào)告,詳細(xì)介紹 Baichuan 2 的訓(xùn)練細(xì)節(jié),IT之家附 Baichuan 2 下載地址:https://github.com/baichuan-inc/Baichuan2

據(jù)百川智能官方介紹,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 萬(wàn)億高質(zhì)量多語(yǔ)言數(shù)據(jù)進(jìn)行訓(xùn)練,兩個(gè)模型在數(shù)學(xué)、代碼、安全、邏輯推理、語(yǔ)義理解等能力有顯著提升。

其中 Baichuan2-13B-Base 相比上一代 13B 模型,數(shù)學(xué)能力提升 49%,代碼能力提升 46%,安全能力提升 37%,邏輯推理能力提升 25%,語(yǔ)義理解能力提升 15%。

圖片

▲ 圖源“百川智能”公眾號(hào),下同

在 MMLU、CMMLU、GSM8K 等基準(zhǔn)測(cè)試中,百川智能的兩個(gè)模型都比 LLaMA 2 的分?jǐn)?shù)要高一些,且在“中文通用”部分優(yōu)勢(shì)較大。

7B 參數(shù)模型的 Benchmark 成績(jī)

▲ 7B 參數(shù)模型的 Benchmark 成績(jī)

13B 參數(shù)模型的 Benchmark 成績(jī)

▲ 13B 參數(shù)模型的 Benchmark 成績(jī)

Baichuan2-7B 和 Baichuan2-13B 不僅對(duì)學(xué)術(shù)研究完全開(kāi)放,開(kāi)發(fā)者也僅需郵件申請(qǐng)獲得官方商用許可后,即可以免費(fèi)商用。騰訊云、阿里云、火山方舟、華為、聯(lián)發(fā)科等企業(yè)均參加了本次發(fā)布會(huì)并與百川智能達(dá)成了合作。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:百川智能,Baichuan大模型,LLaMA
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知