設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

“端側(cè) ChatGPT 時(shí)刻到來”,面壁智能推出小鋼炮開源 MiniCPM3-4B AI 模型

2024/9/6 8:20:17 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 9 月 6 日消息,面壁智能官方公眾號(hào)昨日(9 月 5 日)發(fā)布博文宣布推出開源 MiniCPM3-4B AI 模型,聲稱“端側(cè) ChatGPT 時(shí)刻到來”。

IT之家附上 MiniCPM 3.0 開源地址:

MiniCPM3-4B 是 MiniCPM 系列的第三代產(chǎn)品,整體性能超過了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 億~90 億參數(shù)的 AI 模型。

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 擁有更強(qiáng)大、更多用途的技能集,可用于更廣泛的用途。MiniCPM3-4B 支持函數(shù)調(diào)用和代碼解釋器。

下面是 3 個(gè)版本的模型結(jié)構(gòu)(1->2->3)的區(qū)別:

  • 詞表大?。?/strong>123K->73K->73K

  • 模型層數(shù):40->52->62

  • 隱藏層節(jié)點(diǎn):2304->1536->2560

  • 最大長度:4k->4K->32k

  • 系統(tǒng)提示詞:不支持-> 不支持-> 支持

  • 工具調(diào)用和代碼解釋器:不支持-> 不支持-> 支持

MiniCPM3-4B 有一個(gè) 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的內(nèi)存,可以處理理論上的無限上下文。

面壁智能還發(fā)布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,針對 RAG 場景還發(fā)布了微調(diào)版 MiniCPM3-RAG-LoRA 模型。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知