Mistral AI 推出 Mistral OCR API：宣稱最快最準光學字符識別，千頁 1 美元

2025/3/7 18:20:16 來源：IT之家作者：溯波（實習） 責編：溯波

評論：

IT之家 3 月 7 日消息，Mistral AI 當地時間 6 日宣布推出 Mistral OCR API，并宣稱該 API 在 OCR 光學字符識別領域具有最佳表現。

▲ 左為原文件，右為識別結果

Mistral AI 表示這一 API 具備優(yōu)秀的多模態(tài)文檔處理能力，能從 PDF、幻燈片、數學表達式、LaTeX 學術文檔等復雜文檔元素中提取文本內容，所得結果將以 Markdown 文件的形式清晰呈現。

Mistral OCR 模型可解析、理解和轉錄數千種腳本、字體和語言。根據 Mistral AI 給出的數據，該模型現有版本在識別中的表現優(yōu)于谷歌 Document AI、微軟 Azure OCR、OpenAI GPT-4o 等一系列競爭者。

Mistral AI 推出 Mistral OCR API：宣稱最快最準光學字符識別，千頁 1 美元

▲ 左為原文件，右為識別結果

Mistral AI 已將 Mistral OCR 作為其 Le Chat 聊天機器人的默認文檔理解模型，該 API 的定價為每千頁 1 美元（IT之家備注：當前約 7.2 元人民幣），單節(jié)點每分鐘可處理 2000 頁，這一模型已被用于歷史文化遺產保護等場景。

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

關鍵詞：Mistral，OCR，人工智能

相關文章