設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

面壁智能發(fā)布 MiniCPM-o 2.6 全模態(tài)模型,號稱“端側 GPT-4o”

2025/1/16 18:23:58 來源:IT之家 作者:清源 責編:清源

IT之家 1 月 16 日消息,面壁智能公眾號今日宣布推出“小鋼炮”MiniCPM-o 2.6 端側全模態(tài)模型,參數(shù)為 8B,號稱性能比肩 GPT-4o、Claude-3.5-Sonnet。

其采用了端到端多模態(tài)架構,可同時處理文本、圖像、音頻和視頻等多種類型的數(shù)據(jù),生成高質量文本和語音輸出。官方表示,其總參數(shù)量 8B,視覺、語音和多模態(tài)流式能力達到了 GPT-4o-202405 級別,是開源社區(qū)中模態(tài)支持最豐富、性能最佳的模型之一。

MiniCPM-o 2.6 支持可配置聲音的中英雙語語音對話,還具備情感 / 語速 / 風格控制、端到端聲音克隆、角色扮演等進階能力。

據(jù)官方介紹,MiniCPM-o 2.6 也是首個支持在 iPad 等端側設備上進行多模態(tài)實時流式交互的多模態(tài)大模型。其在 OpenCompass 榜單上(綜合 8 個主流多模態(tài)評測基準)平均得分 70.2,以 8B 量級的大小在單圖理解方面超越了 GPT-4o-202405、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等主流商用閉源多模態(tài)大模型。

IT之家附開源地址:

  • GitHub:https://github.com/OpenBMB/MiniCPM-o

  • huggingface:https://huggingface.co/openbmb/MiniCPM-o-2_6

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

軟媒旗下網站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知