Mistral OCR 3: новая модель для работы с документами
Mistral AI анонсировала Mistral OCR 3 – улучшенную модель анализа документов. Она справляется не только с простым извлечением текста, но и разбирает разборчивый почерк, плотно заполненные бланки и запутанные таблицы, включая ячейки с пересечениями. По данным разработчиков, эта версия обходит предыдущую в 74% тестовых сценариев. Особенно заметны успехи в обработке рукописного текста, сканов форм и сложных табличных структур. Кроме того, Mistral OCR 3 не уступает специализированной модели распознавания символов от Deepseek.
Модель работает через API или на платформе Document AI, запущенной в мае. Стоимость – два доллара за тысячу страниц, с возможностью скидок при больших объемах. Французская компания, недавно получившая крупные вложения от производителя чипов ASML, таким образом усиливает свои позиции в сфере распознавания документов. Это происходит на фоне того, что ее текущие открытые языковые модели пока уступают коммерческим аналогам из США.