Сегодня 24 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатель Discord покинул пост гендиректора ради нового будущего компании 7 ч.
Google Gemini проиграл ИИ-гонку — пользователи предпочитают ChatGPT и Meta AI 7 ч.
Российский суд запретил Google продолжить процесс по банкротству «Гугл» в США 8 ч.
Создатели The Quarry и Until Dawn должны были выпустить экшен во вселенной «Бегущего по лезвию» — детали отменённой Blade Runner: Time To Live 8 ч.
«Ошеломляющий объём работы»: ремастер The Elder Scrolls IV: Oblivion поразил дизайнера оригинальной игры 9 ч.
Минфин и ЦБ РФ запустят криптобиржу для «суперквалифицированных» инвесторов 11 ч.
«Возвращает легенду в строй»: антиутопическое приключение на колёсах Beholder: Conductor вышло в Steam и порадовало игроков 11 ч.
Герои не нашего времени: Ubisoft анонсировала мобильную блокчейн-игру Might and Magic Fates 12 ч.
Google и X могут стать следующими целями для Еврокомиссии 13 ч.
Google проиграла биткоину по рыночной капитализации 14 ч.
TSMC уже во всю выпускает чипы по улучшенному 3-нм техпроцессу N3P — на очереди N3X 30 мин.
Рост выручки и прибыли SK hynix превзошёл ожидания аналитиков 3 ч.
Глава Intel произвёл ключевые кадровые перестановки, чтобы распрощаться с бюрократией 3 ч.
Новая статья: Обзор процессорного кулера ID-Cooling Frozn A620 GDL: охлаждение на стиле 6 ч.
Мировые поставки ПК в первом квартале подскочили на 6,7 % благодаря разговорам о трамповских пошлинах 7 ч.
Китайские IT-гиганты всё-таки успели закупить NVIDIA H20 на миллиарды долларов до объявления новых санкций 7 ч.
Новая статья: Обзор планшета DIGMA PRO Empire: успешная попытка усидеть на двух стульях 8 ч.
Учёные предложили буквально пускать золотую пыль в глаза для лечения возрастной слепоты 9 ч.
Meta запустила онлайн-переводы и другие функции на базе ИИ для умных очков Ray-Ban 11 ч.
AMD подтвердила участие в Computex 2025 — ожидается анонс Radeon RX 9060 XT 11 ч.