Mistral lance une reconnaissance OCR ultra-performante
Le français Mistral annonce le lancement d’une API permettant de convertir efficacement des documents contenant textes, images, tables et autres formules en documents markup.

Mistral lance une solution de reconnaissance OCR alimentée à l’IA générative disponible via une API. L’outil est capable de comprendre des documents PDF contenant du texte, des images, des tableaux et des équations, et d’extraire ces éléments dans un document markup ordonné.
La firme française souligne que Mistral OCR est particulièrement adapté pour un usage combiné avec un système RAG. L’outil permet par ailleurs l’emploi de documents comme prompt, si bien qu’il est par exemple possible d’en extraire des informations spécifiques dans des formats tels que JSON, ce qui permet leur exploitation ultérieure.
Disponible via la sa suite destinée aux développeurs, l’API est tarifée 1 dollar pour 1’000 pages. Selon l’évaluation de la firme, Mistral OCR surclasse ses concurrents Azure OCR et Google Document AI, tant sur la reconnaissance des divers éléments du document que sur la prise en charge multilingue. Plus légère, la solution est aussi plus performante. Mistral relève enfin que l’API peut être hébergée on premise pour les organisaitons ayant des exigences strictes de protection des données.