IT之家 9 月 25 日消息,百川智能今日宣布推出 Baichuan2-53B 閉源大模型,全面升級(jí)了 Baichuan-53B 的各項(xiàng)能力。
據(jù)介紹,Baichuan2-53B 不僅數(shù)學(xué)和邏輯推理能力提升顯著,還通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺,號(hào)稱是“目前國(guó)內(nèi)幻覺問題最低的大模型”。
百川智能此次還開放了 Baichuan2-53B API 接口,正式進(jìn)軍 To B 領(lǐng)域,開啟商業(yè)化進(jìn)程。
IT之家查詢發(fā)現(xiàn),Baichuan2-53B 是百川智能發(fā)布的第 6 款大模型,自 4 月 10 日成立以來,百川智能平均每 28 天推出一個(gè)大模型。
百川智能表示,在 Baichuan-53B 的基礎(chǔ)上,Baichuan2-53B 不僅重點(diǎn)強(qiáng)化了以上兩個(gè)維度的能力,并且對(duì)整體能力進(jìn)行了全面升級(jí)。其中,邏輯推理能力提升 100%,數(shù)學(xué)能力提升 31%,語(yǔ)言理解能力提升 29%,文本創(chuàng)作提升 18%,知識(shí)問答提升 9%。
Baichuan2-53B 在幻覺處理方面也進(jìn)行了優(yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面,Baichuan2-53B 號(hào)稱“獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系”。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保模型始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
信息獲取方面,Baichuan2-53B 對(duì)多個(gè)模塊進(jìn)行了升級(jí),包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過深入理解用戶指令,精確驅(qū)動(dòng)查詢?cè)~搜索,最終結(jié)合大語(yǔ)言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實(shí)現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺。
百川智能使用 FacTool 評(píng)測(cè)后的結(jié)果顯示,Baichuan2-53B 綜合得分為 140.5,在主流基礎(chǔ)大模型中僅排在 GPT-4 之后。
IT之家注:FacTool 是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)研究人員提出的一款通用框架,能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性(也能查核一般性內(nèi)容的事實(shí)準(zhǔn)確性)。
除了能力全面升級(jí),Baichuan2-53B 還開放了 API 接口,企業(yè)和開發(fā)者可以通過 API 將 Baichuan2-53B 集成至他們的應(yīng)用程序和服務(wù)中。IT之家查詢發(fā)現(xiàn),Baichuan2-53B 的 API 調(diào)用服務(wù)采用按照時(shí)間段分檔收費(fèi)的方式:
每日的 8:00 至 24:00,按照每千 tokens 0.02 元的方式收費(fèi);
每日的 00:00 至 8:00 期間,按照每千 tokens 0.01 元的方式收費(fèi)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。