Reconnue pour ses projets de recherche en intelligence artificielle, ILLUIN Technology a développé des services d’accompagnement pour les grands groupes, mais également une suite de produits. A commencer par Dialogue, un outil développé à partir de 2018 pour concevoir des agents conversationnels. Il a été déployé à grande échelle par de grands groupes français, parmi lesquels Enedis, EDF, La Macif, Boursobank, Randstad et Geopost. L’entreprise compte une soixantaine de clients.
Depuis, ILLUIN a élargi son offre avec différents services dédiés au traitement intelligent des documents – Doc Automation, Mail Automation, Search – mais aussi à l’analyse vocale et à l’intention client chaude et froide – Voice Parser et Speech Analyser.
« Sur le segment du traitement intelligent de documents, nos grands clients nous ont soumis à des benchmarks assez solides », précise Robert Vesoul, co-fondateur et PDG d’ILLUIN Technology. « Nos solutions permettent de traiter les documents les plus complexes : une facture d’hôpital, une fiche de paie, un constat d’accident de voiture, etc. ».
Les noms de ces produits ont évolué. Eux-mêmes ont été largement « remodelés » sous l’influence de l’IA générative, selon le responsable.
Il y a cependant une constante depuis quatre ans. Ils s’appuient tous sur une « colonne vertébrale » principale. «Nous avons décidé en 2023 d’en faire un produit à part entière», précise Robert Vesoul. « C’est le cadre que nous ouvrons à tous nos clients pour qu’ils l’utilisent dans les cas de projets de développement, de production sur mesure, d’IA et d’IA générative. » Ce framework est la plateforme nAIxt. Il se présente comme un « studio low-code » destiné à couvrir la conception d’applications impliquant l’orchestration de modèles d’IA, génératifs ou non. La communauté scientifique parle d’un système d’IA composite.
Alors que Copilot et ChatGPT ont dominé la scène au cours des deux dernières années, certaines entreprises espèrent bénéficier de l’automatisation supplémentaire que les LLM apportent aux processus métier. «J’ai récemment participé à une conférence au sommet Positive AI. Certains intervenants ont évoqué le fait que les organisations les plus avancées en matière d’IA générative sont celles qui développent véritablement des applications sur-mesure, leur cœur de métier », précise Robert Vesoul.
Un manque d’outils spécifiques
Cependant, les outils disponibles pour ce faire restent complexes ou limités. Des frameworks comme LangChain et LlamaIndex se sont imposés, mais le paysage des outils s’agrandit et ces bibliothèques nécessitent l’intervention de développeurs ou de personnes familiarisées avec Python ou JavaScript. « Ces solutions open source évoluent vite, mais couvrent une partie du sujet, et leur développement a été peu inspiré au regard de l’intégration des systèmes d’information des entreprises », estime Robert Vesoul. LangChain existe également dans une distribution commerciale plus complète dans ce domaine que son projet open source.
Historiquement, la majorité des équipes d’analyse et de science des données comptent des membres qui ne sont pas formés à Python et JavaScript. Ceux-ci et les externes utilisent ou utilisent depuis longtemps des outils avec une interface WYSIWYG pour gérer les pipelines de données. Traiter les données comme du code reste un concept relativement nouveau et les obstacles à l’adoption des pratiques DevOps/MLOps restent élevés.
« L’orchestration d’un framework en Python dans une organisation qui rassemble des data scientists, des data ingénieurs et des data architects constitue un enjeu majeur », illustre Robert Vesoul. “Peu d’entreprises parviennent à le faire efficacement.”
Les fournisseurs de cloud tentent d’y remédier, mais certaines entreprises, dont certains clients d’ILLUIN, outre le verrouillage propriétaire, craignent des conflits d’intégration entre des solutions parfois concurrentes. « Certains de ces outils dans les différents cloud dépendent de biais, qui ne sont pas forcément ceux de l’organisation pour d’autres projets de développement », note Robert Vesoul.
À cela s’ajoute la nécessité de gérer plusieurs modèles de langage majeurs, mais aussi différents algorithmes en tout genre. “Il y a la question des performances, mais aussi des coûts”, ajoute-t-il. « Aujourd’hui, les entreprises en 2024-2025 ont répertorié (ou sont en train de terminer de répertorier) les cas d’usage prioritaires. Ils doivent maintenant organiser, développer, orchestrer cela à travers l’organisation. Et la première case à cocher n’est autre que celle de la consommation des tokens : le rapport performance-coût.
« La plupart des grands clients que nous interrogeons nous disent : « un de nos défis est de profiter de ces modèles, mais en restant indépendant » », relate le PDG d’ILLUIN Technology.
L’agnosticité, le maître mot
C’est l’un des arguments clés de la startup pour convaincre les grands groupes. Sa plateforme doit orchestrer de manière agnostique des workflows alimentés par une IA « hybride », que ce soit sur les trois grandes infrastructures cloud (GCP, Azure, AWS), sur des cloud SecNumCloud souverains et qualifiés (dont OVHcloud), mais aussi sur site. « Il s’agit de prouver que l’on peut opérer des cas d’usage sans recourir aux API OpenAI, déployer rapidement des capacités et également changer de composants technologiques de différents fournisseurs au cours d’un projet », précise Ghislain Jeanneau, directeur produit nAIxt chez ILLUIN Technology.
Techniquement, les clients et partenaires d’ILLUIN s’y retrouvent. C’est la base technique des produits mentionnés ci-dessus. C’est également une solution familière pour les équipes Data & IA.
Selon la présentation de Ghislain Jeanneau, nAIxt structure un projet en deux phases. Il y a d’abord la configuration en studio, puis l’exécution, c’est-à-dire la transformation des données « en résultats exploitables » via les API déployées.
Les utilisateurs manipulent des projets comprenant des objets réutilisables – prompts, vocabulaire, etc. « Les modèles de projet permettent de commencer rapidement à travailler sur des cas d’usage fréquents, comme le RAG, le traitement de documents, un paradigme orienté agent, etc. », assure Ghislain Jeanneau.
Le développement dans nAIxt s’articule autour de deux types d’objets. Tout d’abord, il existe un objet de type pipeline permettant de décrire le traitement par glisser-déposer en quelques étapes seulement. L’objet « tests sets » regroupe les données de tests sur lesquelles les pipelines seront testés à chaque modification. “A chaque modification apportée, le pipeline est à nouveau exécuté et nous permet de comprendre l’impact des modifications apportées.”
Une fois le pipeline prêt, le bouton « déployer » expose ce pipeline via une API. Une interface et des modules permettent d’évaluer les performances et l’explicabilité des résultats en phase de configuration et pendant l’exécution. L’interface utilisateur comprend une fonction d’estimation des coûts permettant de déterminer, au moyen de phases itératives de tests de pipeline, quels sont les modèles d’IA les plus pertinents à exploiter. En cas d’erreur, de problèmes ou à des fins RSSI, la plateforme conserve des journaux d’audit.
Sur le papier, tout cela ressemble à un outil ETL/ELT (extraction, chargement et transformation de données). Mais ici, le T ne correspondrait pas seulement au moteur de requête d’une base de données ou à une technologie de type Apache Spark, mais à différentes modalités de transformation, incarnées par l’inférence de modèles d’IA (LLM, VLM, vision par ordinateur, NLP, etc.). Ces transformations peuvent avoir lieu à différents endroits d’un pipeline pour structurer les résultats et peuvent être liées entre elles. Ils sont réalisés par des opérateurs, des fonctions spécifiques qui appellent différents LLM et outils. ILLUIN affirme compter plus de 150 opérateurs. Le code généré par la plateforme peut être exécuté via des fonctions en mode « sans serveur » sur des services FaaS tiers.
S’il s’agit finalement de créer un runtime, les entreprises peuvent accéder au code source des pipelines selon leurs besoins. L’outil de programmation visuelle génère arbitrairement du code TypeScript. « Nous avons choisi ce langage car il permet de gérer des charges de travail très asynchrones », explique le chef de produit.
nAIxt s’intègre à diverses plateformes dont Amazon Bedrock, Google Vertex AI, Azure AI, Microsoft Sharepoint, Google Drive, Salesforce, Dynamics 365, des bases de données vectorielles (Qdrant, Elasticsearch), des outils d’inférence de modèles (vLLM, TGI, Ollama), etc.
Les documents eux-mêmes peuvent être manipulés en studio et un système d’explicabilité vise à relier l’information à ses sources. Certains opérateurs appliquant la méthode des K plus proches voisins permettent par exemple de vérifier qu’un montant affiché sur une facture est proche de celui annoncé dans un contrat. Ici, ILLUIN recommande d’utiliser des modèles de langage de vision, une architecture RAG et sa technique ColPali, exploitant les modèles « openweight » de Google PaliGemma pour créer des intégrations visuelles permettant une extraction plus fidèle des données à partir de PDF ou JPG.
« Les cas d’usage de l’IA générative se concentrent souvent sur des applications conversationnelles, où le résultat final est généralement une simple chaîne de caractères ou JSON », note Ghislain Jeanneau. « Il manque des outils permettant un pré-traitement ou un post-traitement avancé des données selon des conditions précises », assure-t-il. « Cela limite les possibilités aux automatisations de bout en bout, souvent orientées vers des flux de travail spécifiques. Avec l’IA générative, ces scénarios sont moins directs que les approches traditionnelles, ce qui rend les outils d’orchestration essentiels pour atteindre un niveau d’automatisation plus élevé.
ILLUIN Technology pense avoir trouvé un moyen de se démarquer
Les joueurs français ou d’origine française déclarent cocher le cache agnostique, notamment LightOn et Dataiku. « Ma compréhension est que Lighton est davantage axé sur les assistants, l’interaction utilisateur et l’enchaînement de tâches simples, tandis que Dataiku, issu d’un ADN plus traditionnel, reste axé sur la formation de modèles, le MLOps et l’analyse classique » compare Robert Vesoul. « NAIxt cherche à unifier ces approches avec un studio de développement capable de gérer toute la gamme des cas d’utilisation de l’IA générative, des pipelines de back-office aux outils conversationnels, où les solutions existantes sont souvent limitées. La plateforme ILLUIN serait alors complémentaire de ces deux solutions. Et plutôt en avance sur le marché.
Pourtant, des acteurs comme Microsoft, AWS, Google Cloud et Salesforce veulent ou peuvent gérer des processus de ce type. Pour l’instant, ils ont encore renforcé les assistants avec les outils et l’architecture RAG pour en faire une sorte de « ShivaGPT ». Lors de la présentation officielle de nAIxt le 4 décembre, Geopost a annoncé son intention d’utiliser l’IA générative pour extraire et analyser les événements liés aux colis à partir des journaux SI, afin de produire des synthèses exploitables. Ces synthèses peuvent être présentées aux conseillers pour répondre aux clients ou directement intégrées aux interactions via des robots conversationnels, sans nécessairement recourir à une architecture RAG. « Les organisations matures sur ces sujets recherchent désormais des outils adaptés pour mettre en œuvre ce type de processus de bout en bout », insiste le PDG.
Pour l’instant, ILLUIN continue de cibler « les grandes organisations publiques et privées », mais espère fédérer une communauté plus large en proposant une distribution open source de nAIxt en 2025. Une manière également de se développer sur le marché ETI.