(San Francisco) OpenAI, le créateur de ChatGPT, a lancé jeudi Operator, un agent d’IA (intelligence artificielle) capable d’effectuer des tâches en ligne pour l’utilisateur, comme planifier des vacances, réserver un restaurant ou faire des courses, une étape importante dans le course aux assistants IA toujours plus efficaces.
Publié hier à 20h32
L’opérateur “utilise son propre navigateur”, il peut “consulter une page web, la parcourir, cliquer sur des boutons” et “remplir des champs de texte comme les gens le font quotidiennement”, a indiqué l’entreprise californienne dans un communiqué.
La nouvelle fonction n’est pour l’instant accessible qu’aux abonnés professionnels ChatGPT, afin de l’améliorer grâce aux retours d’expérience.
« L’opérateur est l’un de nos premiers agents, c’est-à-dire une IA capable d’effectuer des tâches à votre place de manière autonome : vous lui confiez une tâche et il l’exécute », résume OpenAI.
L’explosion de l’IA générative avec le succès de ChatGPT depuis fin 2022 a lancé une course effrénée aux assistants IA entre géants de la technologie, qui déploient rapidement des outils capables d’écrire des messages, de répondre à des questions, de générer des images, etc.
Le Saint Graal de la Silicon Valley, ce sont les agents IA, lorsque la machine devient une sorte de secrétaire omnisciente, disponible à tout moment et capable d’effectuer de nombreuses tâches, de l’envoi de messages aux achats sur Internet.
-Dans ce domaine, OpenAI n’est pas le plus rapide, du moins en termes de déploiement.
Operator ressemble à « Computer Use », une fonctionnalité lancée en octobre par Anthropic, un démarrer rival.
L’utilisation de l’ordinateur permet à Claude, l’interface d’IA générative d’Anthropic, d’utiliser les ordinateurs comme un humain, depuis la sélection de boutons jusqu’à la saisie de texte et la gestion de différents logiciels.
Google, qui a présenté Gemini 2.0, sa nouvelle famille de modèles d’IA générative, en décembre, va également de l’avant avec des interactions plus complexes avec la technologie, pour que les agents d’IA naviguent de manière autonome sur Internet, recherchent des informations complémentaires en ligne ou dans un document, etc.
Toutes les entreprises précisent que les assistants IA agissent sous la supervision d’humains : s’ils peuvent sélectionner les produits à acheter sur un site e-commerce, ils ne peuvent pas (encore) cliquer sur le bouton de paiement.
La version d’OpenAI comprend une vidéo montrant le fonctionnement d’Operator. Un ingénieur lui demande de trouver une recette et d’ajouter les ingrédients nécessaires à son panier sur un service de commande en ligne : l’agent IA se rend sur le site de cuisine, pose des questions supplémentaires à l’utilisateur et lui demande de se connecter lorsque cela est nécessaire.
Related News :