感謝IT之家網友 軟媒用戶1392612、蘭花是我 的線索投遞!
IT之家 3 月 7 日消息,Mistral AI 當地時間 6 日宣布推出 Mistral OCR API,并宣稱該 API 在 OCR 光學字符識別領域具有最佳表現。
Mistral AI 表示這一 API 具備優(yōu)秀的多模態(tài)文檔處理能力,能從 PDF、幻燈片、數學表達式、LaTeX 學術文檔等復雜文檔元素中提取文本內容,所得結果將以 Markdown 文件的形式清晰呈現。
Mistral OCR 模型可解析、理解和轉錄數千種腳本、字體和語言。根據 Mistral AI 給出的數據,該模型現有版本在識別中的表現優(yōu)于谷歌 Document AI、微軟 Azure OCR、OpenAI GPT-4o 等一系列競爭者。
Mistral AI 已將 Mistral OCR 作為其 Le Chat 聊天機器人的默認文檔理解模型,該 API 的定價為每千頁 1 美元(IT之家備注:當前約 7.2 元人民幣),單節(jié)點每分鐘可處理 2000 頁,這一模型已被用于歷史文化遺產保護等場景。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。