設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
国资委:将对整车央企进行战略性重组    小米新机重拾 UWB 技术

面壁智能發(fā)布 Eurux-8x22B 開源大模型:代碼性能超越 Llama3-70B

2024/5/3 23:53:08 來源:IT之家 作者:泓澄(實(shí)習(xí)) 責(zé)編:泓澄
感謝IT之家網(wǎng)友 風(fēng)見暉一 的線索投遞!

IT之家 5 月 3 日消息,面壁智能發(fā)布開源大模型 Eurux-8x22B,包括 Eurux-8x22B-NCA 與 Eurux-8x22B-KTO,主打推理能力。

官方測(cè)試中,Eurux-8x22B 在 LeetCode(180 道 LeetCode 編程真題)與 TheoremQA (IT之家注:美國大學(xué)水準(zhǔn)的 STEM 題目)測(cè)試超越了 Llama3-70B,在 LeetCode 測(cè)試上超越閉源的 GPT-3.5-Turbo。

官方測(cè)試結(jié)果

▲ 官方測(cè)試結(jié)果

據(jù)介紹,Eurux-8x22B 模型激活參數(shù) 39B,支持 64k 上下文,是由 Mixtral-8x22B 模型對(duì)齊而來,在 UltraInteract 對(duì)齊數(shù)據(jù)集上訓(xùn)練而成。

官方測(cè)試數(shù)據(jù)

▲ 官方測(cè)試數(shù)據(jù)

UltraInteract 是專門設(shè)計(jì)用于提升大模型推理能力的大規(guī)模、高質(zhì)量的對(duì)齊數(shù)據(jù)集,包含了覆蓋數(shù)學(xué)、代碼和邏輯推理問題的 12 個(gè)開源數(shù)據(jù)集的 86K 條指令和 220K 偏好對(duì),共有五十萬條左右數(shù)據(jù)。

UltraInteract 過程

UltraInteract 示例

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:面壁智能,LLM大模型
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知