Avec l’opérateur, les ambitions d’Openai dans l’agence AI deviennent plus claires

Avec l’opérateur, les ambitions d’Openai dans l’agence AI deviennent plus claires
Avec l’opérateur, les ambitions d’Openai dans l’agence AI deviennent plus claires

Le tour d’Openai de lancer un agent d’IA qui dépousse le concept de RPA. L’éditeur Chatgpt a dessiné l’aperçu de l’opérateur, capable de contrôler un navigateur Web pour effectuer des actions autonomes.

OpenAI a annoncé le lancement d’une préversion d’un outil appelé opérateur, présenté comme un agent IA polyvalent capable de prendre le contrôle d’un navigateur Web et de réaliser certaines actions indépendamment. Selon la documentation de l’entreprise provoquant un chatppt, cet outil peut automatiser diverses tâches – telles que le remplissage des formulaires, la réserve de voyages ou même la création de mèmes – interagir à distance avec un navigateur Web, de la même manière qu’un personne ne le ferait, par Cliquez sur la souris, défilement et crises de clavier.

Cette description de l’IA agentique rappelle l’outil informatique utilise Anthropic (une version de Claude 3.5 Sonnet capable d’effectuer des tâches simples sur un ordinateur), également capable de simuler les mouvements d’une souris ou des clés du clavier, comme les robots logiciels (RPA) . Google travaille également sur Project Mariner dans Gemini 2.0, avec des objectifs comparables à ceux de l’opérateur d’OpenAI.

L’opérateur est basé sur un modèle appelé agent d’utilisation informatique (CUA), fonctionnant sur GPT-4O. L’outil interprète des captures d’écran. L’utilisateur n’a qu’à décrire la tâche souhaitée, par exemple «réserver un vol» ou «commander des achats». L’agent effectue ensuite les étapes nécessaires, interrompant l’opération en cas d’obstacle tel qu’un CAPTCHA ou un champ de mot de passe. L’outil invite ensuite l’utilisateur à intervenir, ce qui lui permet de garder le contrôle.

-

L’outil propose également des fonctionnalités pratiques: invite d’enregistrement sur la page d’accueil pour un accès rapide. OpenAI spécifie que l’opérateur reste limité en ce qui concerne des tâches complexes ou spécialisées, telles que la création de présentations détaillées ou l’interaction avec des interfaces non standard.

Parmi les cas d’utilisation avancés par OpenAI figurent les réservations des voyages et des restaurants, ainsi que des commandes en ligne. L’éditeur spécifie de travailler à cet effet avec un certain nombre d’entreprises, notamment Openable, StubHub, Instacart, Doordash et Uber.

 
For Latest Updates Follow us on Google News
 

-

PREV La nouvelle menace des vents violents
NEXT Chappell Roan partage son top 10 des looks « emblématiques » de 2024