Mistral AI представила новый ИИ-инструмент

Mistral AI, французская компания, специализирующаяся на больших языковых моделях (LLM), представила новый API — Mistral OCR. Этот API оптического распознавания символов (OCR) позволяет преобразовывать PDF-документы в текстовый формат, упрощая их дальнейшую обработку системами искусственного интеллекта.

Современные генеративные алгоритмы, подобные ChatGPT, наиболее эффективны при обработке необработанного текста. Поэтому для успешной интеграции ИИ-решений компаниям критически важно хранить и индексировать данные в исходном формате, обеспечивая их повторное использование ИИ-системами.

В отличие от многих одномодовых API OCR, Mistral – это мультимодальный API, распознающий не только текст, но и изображения, встроенные в текст. Он выделяет графические элементы, включающие их в выходные данные. Обработка PDF-файлов в Mistral приводит к получению отформатированного Markdown-текста, что значительно повышает эффективность его последующей обработки ИИ-алгоритмами.

Mistral OCR предоставляет гибкие варианты развертывания: на собственной платформе, через облачных партнеров (AWS, Azure и др.), и локально посредством API для организаций, работающих с конфиденциальной информацией. Внутренние тесты на сложных PDF-документах (включая математические формулы, сложные макеты и таблицы) показали превосходство Mistral OCR над аналогичными решениями от Google, Microsoft и OpenAI.