Google entre ce mercredi dans ce qu’il appelle « l’ère agentique ». Le géant californien du numérique lance la deuxième génération de son IA générative Gemini. Gemini 2.0 est conçu pour mieux vous convaincre d’utiliser l’IA, à travers des agents et assistants plus autonomes, plus factuels et bref, plus fiables que l’IA générative actuelle.
Concrètement, Google met en ligne dès ce mercredi une version expérimentale de Gemini 2.0 Flash, la version allégée de son IA générative. Il est immédiatement accessible via ses interfaces de formation et de programmation de modèles de langage AI Studio et Vertex AI. Il sera progressivement intégré à l’application Gemini en version mobile et ordinateur personnel.
Ce sera également cette nouvelle version de Gemini qui sera intégrée au moteur de recherche Google, et qui produira les synthèses fournies dans les entêtes des résultats de recherche.
Plus factuel
Malgré tout l’engouement pour des applications comme ChatGPT, d’OpenAI, et Copilot, de Microsoft, il n’en demeure pas moins que l’IA générative est globalement très imparfaite. Que ce soit dans sa manière de générer du texte ou des images, il lui manque encore une bonne dose de jugement qui l’empêcherait parfois d’écrire ou de dessiner à peu près n’importe quoi. Ces farces, élégamment qualifiées jusqu’à présent d’« hallucinations », ont limité une adoption plus formelle et plus large des outils d’IA, que ce soit pour le travail ou pour les loisirs.
Avec Gemini 2.0, Google promet de mieux limiter les erreurs de son IA, ce qui en fera un meilleur assistant, voire un agent pour l’utilisateur. “Ce sera plus factuel, ce qui le rendra plus utile pour la recherche en ligne, et plus multimodal”, a résumé Tulsee Doshi, directeur de projet pour Google DeepMind, via un appel vidéo. “Vous aurez également plus de contrôle sur la façon dont il s’exprime.” Par exemple, à l’oral, Gemini 2.0 parlera en plusieurs langues avec huit tons de voix différents, personnalisables. Vous pourriez lui demander de « parler comme un pirate ». Gemini 2.0 générera également lui-même des images textuelles.
Cette polyvalence permet d’améliorer des agents comme celui du Projet Astra. Ce projet est en fait le prototype d’un assistant personnel numérique alimenté par l’IA. Il s’adapte sur mobile. Vous lui parlez, vous pointez l’appareil photo de votre téléphone vers un objet, un lieu ou un document, et il vous fournira naturellement de nombreuses informations pertinentes.
Propulsé par Gemini 2.0, Project Astra peut mémoriser les 10 minutes les plus récentes de votre conversation et, pour plus de contexte, il peut fouiller dans vos conversations précédentes. Cet agent a fière allure sur mobile, mais il ferait un carton dans les lunettes connectées, un gadget avec lequel Google jongle depuis plusieurs mois déjà et qui pourrait voir le jour prochainement.
De la navigation Web aux jeux vidéo
Google a présenté trois autres exemples d’agents IA qui profitent des performances légèrement améliorées de Gemini 2.0. Le premier, baptisé Project Mariner, navigue pour vous sur le web et automatise les tâches répétitives ou fastidieuses. Par exemple, il peut collecter la meilleure façon de contacter une liste d’entreprises en visitant leurs sites Web un par un. Il peut aller jusqu’à faire les courses pour vous, vous demandant seulement d’intervenir au moment de payer.
Jules est un autre agent qui se présente comme assistant en programmation informatique. Ce n’est pas nouveau : Microsoft dispose du même type d’outils dans sa propre boîte à outils d’IA. Mais Jules serait meilleur pour repérer les bogues dans le code et les corriger, vous laissant carte blanche pour accomplir des tâches plus significatives.
Enfin, Google pense que Gemini pourrait devenir un compagnon de jeu vidéo. “Imaginez une IA qui vous aiderait à progresser dans le jeu et vous donnerait des conseils en vous regardant jouer”, a illustré Rushil Mistry, un autre directeur produit chez Google DeepMind. C’est moins un agent d’IA qu’un petit frère voulant en faire un peu trop, mais l’idée est là : cette IA pourrait faire du mal à tous ces sites spécialisés dans les guides pas à pas pour les jeux vidéo.
Et ce n’est qu’un exemple parmi tant d’autres de ce que Google espère être l’avenir immédiat de l’intelligence artificielle : l’ère de l’agentique.