Mistral OCR 4 把文件 AI 變成採購題
Mistral OCR 4 把文件處理變成價格與部署選擇。它支援 170 種語言,批次 OCR 每 1,000 頁只要 2 美元,還能輸出結構化資料。

Mistral OCR 4 把文件處理變成價格與部署選擇,批次 OCR 每 1,000 頁只要 2 美元。
Mistral OCR 4 在 2026 年 6 月 23 日推出。它不只讀文字。它還回傳結構化文件資料,包含 bounding boxes、block types 和 confidence scores。
更直接一點說,這產品把 OCR 變成算帳問題。標準價格是每 1,000 頁 4 美元,batch 模式降到 2 美元。對做發票、理賠、合約、表單的人來說,這不是小數字。
| 指標 | 數值 | 意義 |
|---|---|---|
| 推出日期 | 2026-06-23 | 決定產品上線窗口 |
| 標準 OCR 價格 | US$4 / 1,000 頁 | 一般工作負載成本 |
| Batch OCR 價格 | US$2 / 1,000 頁 | 離線批次處理更便宜 |
| Document AI 價格 | US$5 / 1,000 頁 | 輸出固定 JSON schema |
| 語言覆蓋 | 170 種語言 | 跨國文件流程更好用 |
| OlmOCRBench 分數 | 85.20 | 官方提供,但要保留態度 |
它到底交付了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Mistral 把 OCR 4 定位成文件理解模型,不是傳統 OCR 引擎。它可直接吃 PDF、DOC、PPT 和 OpenDocument 檔案,然後輸出頁面結構,不是單純文字。

這差很多。傳統 OCR 通常只吐出字串。後面要靠你的程式自己猜標題、表格、欄位和數字位置。OCR 4 直接把這些資訊包進輸出。
Mistral 宣稱它支援 170 種語言,涵蓋 10 個語言群組。對跨國團隊來說,這不是宣傳稿而已。它會直接影響一套流程能不能吃下整個後台。
- 輸入:PDF、DOC、PPT、OpenDocument
- 輸出:bounding boxes、block types、confidence scores
- 語言:170 種,分成 10 個語言群組
- 部署:Mistral API、Amazon SageMaker、Microsoft Foundry
結構化輸出,才是重點
OCR 4 最有意思的地方,不是文字更乾淨。是它把頁面座標、區塊標籤和信心分數放在同一份輸出裡。這讓流程可以追溯每個值是從哪個區域抓到的。
這對稽核很重要。理賠系統抓保單號,或法遵流程抓簽名時,系統可以回指來源區塊。它不會只剩下一串你無法驗證的字。
講白了,這是在少寫 glue code。以前你要自己拆標題、表格、頁尾和註記。現在模型先幫你做一半。
“Mistral OCR 4 extracts and structures content from a wide range of documents. Where previous generations focused on converting a page into clean text and tables, OCR 4 returns a structured representation of the document.”
Mistral,OCR 4 公告
這段話講得很直白。OCR 4 的目標不是把頁面變成可讀文字而已。它是在把文件變成可程式處理的資料。
還有一個產品要分開看。Mistral Document AI 每 1,000 頁 5 美元,會再跑第二次模型呼叫,轉成自訂 JSON schema。你如果要固定欄位輸出,這個模式比較對味。
價格比 benchmark 更有殺傷力
OCR 4 的價格很直接。標準 API 是每 1,000 頁 4 美元,batch 模式降到 2 美元,Document AI 是 5 美元。這種價位會直接改變團隊要不要自己蓋系統。

如果一年處理 100,000 頁,batch OCR 4 大概是 200 美元。同量級下,Azure Document Intelligence custom extraction 大約是 3,000 美元。這是 15 倍差距,財務部門看了會很有感。
Azure 的 Read tier 每 1,000 頁約 1.50 美元,便宜很多。但它主要回傳文字,不是 OCR 4 這種結構化輸出。兩者根本不是同一種東西。
- OCR 4 batch:US$2 / 1,000 頁
- OCR 4 standard:US$4 / 1,000 頁
- Document AI:US$5 / 1,000 頁
- Azure Document Intelligence custom:US$30 / 1,000 頁
- Google Form Parser:約 US$30 / 1,000 頁
自架模型也要算進去。Baidu Unlimited-OCR 看起來沒有 per-page 授權費,但你還是要付 GPU、部署和維運成本。免費通常只是帳單晚一點來。
所以 OCR 4 的價格不是行銷話術。它提供的是一個可和基礎設施成本直接對照的託管服務報價。這對採購很重要。
benchmark 可以看,但別當聖旨
Mistral 公布的 OlmOCRBench 分數是 85.20,還說它是整體最佳模型。這句話要先打折看。公開的 OlmOCRBench 排行,在 OCR 4 發表前的版本裡,前面還有其他模型。
公開榜上,Infinity-Parser2-Pro 是 87.6,Chandra-2 是 85.9。OCR 4 的 85.20 是官方數字,還沒有在公開榜上被完整獨立驗證。
這不代表它不值得看。只是 benchmark 只能當方向,不該當結論。企業買單時,更重要的是準確率、可追溯性和成本。
- Mistral 宣稱分數:85.20
- 公開榜首:87.6
- 公開第二名:85.9
- 公開 benchmark 規模:7,010 個測試,來自 1,403 份 PDF
這個 benchmark 本身也有大約 1 分的誤差空間。所以分數差一點,不代表實際流程就一定輸。真正常壞常常卡在 schema、掃描品質、或人工覆核流程。
企業最在意的是部署
OCR 4 可以走 Mistral 的託管產品,也可以單容器自架。這點對金融、醫療、政府單位很重要。資料要留在特定區域或私有網路時,部署方式就是硬門檻。
這裡還有法規壓力。歐盟 AI Act 的高風險要求會陸續上路。用在招募、金融、醫療和公部門的文件流程,會先感受到這波壓力。
Mistral 本身也跑很快。素材提到它目標是 2026 年營收 10 億歐元,原本大約 2 億歐元。也傳出接近 30 億歐元的募資輪,估值約 200 億歐元。這些數字說明,它很想把文件入口層吃下來。
對工程團隊來說,問題很簡單。你要的是原始文字,還是能直接接後端流程的結構化抽取?如果是後者,OCR 4 值得先試,不用等下一輪採購。
你也可以先看 企業文件抽取整理,以及 自架 AI 合規指南。
接下來怎麼判斷
OCR 4 最後會被真正工作流檢驗,不是發表會。你要看的是,遇到髒掃描時 confidence score 還準不準,長文件的追溯性還在不在,成本能不能打贏舊方案。
如果價格維持不變,結構化輸出也穩,那它在發票、理賠、合約審閱、多語言資料入口會很有競爭力。反過來,如果 benchmark 差距拉大,或自架維運太麻煩,買家就會把它當成眾多選項之一。
我覺得現在最實際的動作,是拿 500 到 1,000 頁真實文件去跑一輪。別只看 demo。看欄位準不準,表格穩不穩,還有每頁成本到底是多少。