設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Mistral 發(fā)布 Pixtral Large 多模態(tài) AI 模型:登頂復(fù)雜數(shù)學(xué)推理,圖表 / 文檔推理超過 GPT-4o

2024/11/19 14:57:21 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 11 月 19 日消息,Mistral AI 公司昨日(11 月 18 日)發(fā)布公告,宣布了全新的多模態(tài) AI 模型 Pixtral Large。該模型擁有 1240 億參數(shù),基于 Mistral Large 2,主要用于處理文本和圖片。

Pixtral Large 現(xiàn)已在 Mistral 研究許可證和商業(yè)許可證下提供,適用于研究、教育以及商業(yè)用途。

Pixtral Large 是 Mistral AI 多模態(tài)家族中的第二個模型。IT之家援引官方新聞稿,該模型在 MathVista、DocVQA 和 VQAv2 等標(biāo)準(zhǔn)多模態(tài)基準(zhǔn)測試中表現(xiàn)出色,尤其在 MathVista 中達(dá)到了 69.4% 的準(zhǔn)確率,超越了所有競爭對手。

在 ChartQA 和 DocVQA 測試中,Pixtral Large 同樣表現(xiàn)優(yōu)異,超越了 GPT-4o 和 Gemini-1.5 Pro。

該模型配備了 123B 的多模態(tài)解碼器和 1B 的視覺編碼器,支持 128K 的上下文窗口,能夠處理至少 30 張高分辨率圖像。Pixtral Large 不僅在視覺數(shù)據(jù)上表現(xiàn)出色,同時在復(fù)雜推理和圖表理解方面也具備強大能力。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Mistral,AI,多模態(tài)
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知