← На главную
Новости· 24.06.2026· 3 мин чтения

Mistral OCR 4 выиграла 72% слепых тестов — и стоит дешевле, чем кажется

Mistral выпустила OCR 4 — модель распознаёт текст из PDF, Word и PowerPoint, поддерживает 170 языков и стоит $2 за 1000 страниц в batch-режиме.

Mistral OCR 4 выиграла 72% слепых тестов — и стоит дешевле, чем кажется
Материал подготовлен с помощью ИИ и проверен редактором

Mistral AI 23 июня выпустила OCR 4 — модель для извлечения текста из документов, которая в независимом тесте на 600+ файлах оказалась предпочтительнее конкурентов в 72% случаев. Цена — $4 за 1000 страниц, или вдвое дешевле в batch-режиме.

Что умеет OCR 4 сверх обычного распознавания

Классические OCR-инструменты вытаскивают «сырой» текст — строку за строкой, без понимания структуры. OCR 4 идёт дальше: модель определяет, где на странице находится каждый элемент и какую роль он играет. Заголовок, таблица, математическая формула, подпись — всё это размечается отдельно через блочную классификацию с bounding boxes на уровне абзацев.

Это принципиально важно для downstream-задач. Если вы строите RAG-пайплайн (retrieval-augmented generation — когда языковая модель ищет ответы в базе документов), вам нужны не просто слова, а осмысленные чанки с контекстом. OCR 4 отдаёт их сразу, без дополнительного парсинга.

Ещё одна деталь — confidence scores: модель выдаёт оценку уверенности для каждого слова и каждой страницы. Это позволяет автоматически флагировать сложные фрагменты и отправлять их на ручную проверку, не прогоняя весь документ заново.

Почему 72% в слепом тесте — это сильный результат

Mistral провела независимое тестирование на более чем 600 документах: рецензенты не знали, какая модель что распознала, и выбирали лучший результат. OCR 4 победила в 72% случаев. Параллельно модель показала 85,20 баллов на OlmOCRBench — публичном бенчмарке для оценки качества OCR.

Важно понимать контекст: слепые тесты, которые проводит сам вендор, всегда нужно читать с поправкой на методологию. Mistral не раскрывает, каких именно конкурентов тестировала и как именно отбирались документы. Тем не менее 72% — это не «чуть лучше», а уверенное большинство, и результат на OlmOCRBench поддаётся независимой проверке.

Поддержка 170 языков при этом не просто маркетинговая строчка: Mistral специально отмечает хорошую работу с редкими языками, что критично для глобальных enterprise-проектов, где документы приходят на арабском, хинди или тайском.

Кому это нужно прямо сейчас

Практический профиль пользователя OCR 4 — команды, которые строят системы обработки документов в масштабе: юридические, финансовые, медицинские. Типичные сценарии:

  • RAG-пайплайны — загрузка корпоративных PDF в векторную базу для поиска по документам
  • Автоматизация ввода данных — извлечение таблиц из счетов, договоров, отчётов
  • AI-агенты — когда агенту нужно «прочитать» документ и принять решение на основе его содержимого

Модель доступна через API Mistral, Mistral Studio и Microsoft Foundry. Стандартная цена — $4 за 1000 страниц, batch-режим — $2 за 1000 страниц. Для сравнения: если обрабатывать 100 000 страниц в месяц в batch-режиме, это $200 — вполне конкурентоспособно с аналогичными сервисами от крупных облачных провайдеров.

Где могут быть ограничения

Несколько вещей, которые стоит проверить перед тем, как строить продакшн на OCR 4.

Во-первых, качество на специфических форматах — рукописный текст, сканы низкого разрешения, нестандартные шрифты — всегда нужно тестировать на своих данных. Бенчмарки отражают среднее по больнице.

Во-вторых, self-hosting: в дополнительном контексте упоминается такая возможность, но детали Mistral пока не раскрыла. Для компаний с требованиями к локальной обработке данных это критичный вопрос.

В-третьих, confidence scores — полезная фича, но она перекладывает на разработчика задачу определить пороговые значения и выстроить логику обработки «сомнительных» фрагментов. Это дополнительная инженерная работа.

Что дальше

Mistral последовательно строит стек для enterprise-обработки документов: сначала базовый OCR API в начале 2025 года, теперь OCR 4 с семантической разметкой и confidence scores. Логичный следующий шаг — интеграция с собственными языковыми моделями Mistral для end-to-end document understanding без промежуточных звеньев.

Пока OCR 4 — это отдельный инструмент, который хорошо стыкуется с любым LLM. Но если Mistral объединит распознавание и понимание в единый пайплайн, конкурировать с ней на рынке enterprise document AI станет заметно сложнее.

Источники

Автор: PLai AI