Mistral AI accélère le rythme. La start-up française la plus en vue dans le domaine de l’IA veut faire ses preuves. Et pour y parvenir, elle n’hésite pas à mettre le paquet sur le développement de ses modèles. Preuve en est avec son dernier modèle, tout juste sorti : Pixtral Large. Dans le détail, il s’agit d’un modèle multimodal à pondération ouverte de 124 milliards de paramètres (rien que ça) construit sur la base de Mistral Large 2.
Deuxième modèle de la famille des modèles multimodaux, il démontre une compréhension des images de «niveau frontière», revendique la start-up, soulignant sa capacité à comprendre des documents, des graphiques et des images naturelles, tout en conservant la compréhension textuelle de pointe de Mistral Large 2. Il dispose également d’une fenêtre contextuelle de 128 000 tokens et peut contenir au moins 30 high- images de résolution.
Mistral rivalise avec Anthropic, Google et OpenAI
En termes de performances, Pixtral Large bat des records. Évalué par rapport à des modèles de type frontière sur un ensemble de benchmarks multimodaux standards, il s’avère meilleur que les modèles publiés par les concurrents directs de Mistral. Ainsi, sur MathVista, qui évalue des raisonnements mathématiques complexes sur des données visuelles, le modèle atteint un score de 69,4 %, surpassant tous les autres modèles. À titre de comparaison, Llama-3.2 90B atteint 49,1%, Gemini-1.5 Pro 67,8%, GPT-4o 65,4% et Claude-3.5 Sonnet 67,1%.
Pour évaluer les capacités de raisonnement sur des graphiques et des documents complexes, les équipes de Mistral se sont appuyées sur les tests ChartQA et DocVQA, où Pixtral Large surpasse également GPT-4o et Gemini-1.5 Pro.
Enfin, Pixtral Large démontre des capacités compétitives sur le test open Source MM-MT-Bench destiné à refléter des cas d’utilisation réels de LLM multimodaux. Il surpasse Claude-3.5 Sonnet, Gemini-1.5 Pro et GPT-4o (les plus récents). Le modèle est disponible sous la licence Mistral Research License (MRL) pour un usage de recherche et pédagogique, précise la start-up, ajoutant qu’il est également disponible sous la licence commerciale Mistral pour l’expérimentation, les tests et la production à des fins commerciales.
Mistral grand mis à jour
Outre Pixtral Large, Mistral Large, son modèle multilingue publié en février dernier, bénéficie d’une mise à jour. Dédié au raisonnement de haut niveau pour des tâches complexes, il est désormais disponible sur pixtral-large-latest, l’API de la start-up, et sous le nom Mistral Large 24.11 sur Hugging Face sous la licence Mistral Research pour la recherche, ou avec une licence commerciale. de Mistral AI pour un usage commercial.
Par rapport à Large 24.07, cette version bénéficie d’améliorations dans la compréhension du contexte long, de l’ajout d’une invite système et d’un appel de fonction plus précis. “Le modèle fonctionne très bien pour les flux de travail RAG et agentiques, ce qui en fait un choix approprié pour les cas d’utilisation en entreprise tels que l’exploration et le partage des connaissances, la compréhension sémantique des documents, les tâches d’automatisation et l’amélioration de l’expérience client”, commente la start-up. Le modèle devrait être rapidement disponible sur les plateformes des fournisseurs, dèscer par Google Cloud et Microsoft Azure en une semaine.
L’interface « Le Chat » capable de concurrencer ChatGPT
Mistral aime faire des entrées remarquées. Et la dernière version de son interface conversationnelle « Le Chat » en est un bon exemple. Dans sa dernière mise à jour, l’interface bénéficie de nombreux ajouts qui feront pâlir OpenAI et son fameux ChatGPT ou encore Google avec Gemini en comparaison. Les dernières fonctionnalités incluent : recherche sur le Web avec citations, canevas d’idéation, édition et exportation en ligne, intégration du dernier modèle Pixtral Large pour une meilleure compréhension des documents et des images, génération d’images, optimisée par Black Forest Labs Flux Pro.
L’outil Canvas ressemble fortement à l’interface au nom éponyme lancée par OpenAI au début du mois. En termes simples, l’interface s’affiche dans la fenêtre de discussion lorsque l’utilisateur a besoin d’aller au-delà des conversations et de se lancer dans la création. Il est possible d’utiliser les différents modèles de Mistral sur des résultats partagés et de modifier le contenu créé directement en ligne sans régénérer les réponses, créer des versions préliminaires et prévisualiser les conceptions.
Bien décidé à se démarquer, Mistral assure qu’il ne cherche pas à continuer « AGI à tout prix ; au lieu de cela, notre mission est de mettre une IA de pointe entre vos mains. Sur « Le Chat », le fleuron français propose donc un niveau gratuit avec ces fonctionnalités bêta et travaille au développement de versions premium avec des garanties de service plus élevées.