La nouvelle IA d’OpenAI bat l’intelligence humaine lors d’un test

OpenAI a dévoilé o3, son nouveau modèle d’intelligence artificielle, dans une vidéo publiée le mois dernier. Plutôt que de montrer le modèle en action, la présentation s’est concentrée sur quelques performances techniques. Sam Altman, PDG d’OpenAI, a simplement décrit le modèle comme « incroyablement intelligent », sans donner plus de détails. De quoi intriguer les observateurs, qui attendent une mise en ligne prévue pour janvier.

Une percée, pas une révolution

L’un des premiers tests réalisés sur o3 est l’ARC-AGI, une évaluation créée par François Chollet, chercheur en intelligence artificielle chez Google. Ce test est connu pour être difficile : il ne mesure pas la capacité d’une IA à mémoriser des données, mais plutôt à apprendre de nouvelles règles à partir d’exemples. Les résultats? o3 a obtenu un score de 76 %, dépassant pour la première fois la moyenne humaine (75 %). Selon le spécialiste français, cette performance marque un véritable « saut qualitatif » dans les capacités des modèles de la série GPT.

Pour autant, ce succès ne signifie pas que o3 soit une intelligence générale artificielle (AGI). François Chollet reste mesuré : « Réussir le test ARC-AGI ne signifie pas atteindre l’AGI. » Même avec son score impressionnant, o3 échoue toujours dans certaines tâches simples, comme déplacer un carré coloré dans une grille. Des problèmes que les humains résolvent sans effort.

Ce qui rend o3 intéressant, c’est son approche différente de ses prédécesseurs. OpenAI n’a pas détaillé son fonctionnement, mais François Chollet avance une hypothèse : le modèle utiliserait une nouvelle forme de « recherche en temps réel » pour résoudre des tâches, à l’instar de techniques empruntées à AlphaZero, le célèbre programme DeepMind. Cette méthode pourrait expliquer pourquoi o3 parvient à adapter ses réponses à de nouveaux problèmes.

Cependant, ce niveau de performance a un coût. Le chercheur souligne que la puissance de calcul nécessaire au fonctionnement de o3 reste un frein. Bien qu’OpenAI n’ait pas divulgué les ressources exactes utilisées, le modèle semble nécessiter beaucoup de temps et d’énergie pour produire ses résultats.

Autre bémol : o3 a été formé spécifiquement sur les données du test ARC-AGI. Cela ne réduit pas ses performances, mais cela soulève des questions sur la capacité du modèle à généraliser ses connaissances en dehors de cet environnement spécifique. Selon François Chollet, il sera intéressant de connaître les scores du modèle face aux nouvelles versions du test, prévues pour janvier.

o3 montre donc des progrès intéressants dans la manière dont les modèles d’IA abordent des tâches complexes. Cependant, les rêves d’une intelligence artificielle équivalente à celle des humains restent encore hors de portée. Comme le rappelle François Chollet, « vous saurez que l’AGI est là lorsqu’il devient impossible de concevoir des tâches faciles pour les humains mais difficiles pour les machines« . Pour l’instant, ce jour n’est pas encore arrivé.

???? Pour ne manquer aucune actualité du Journal du Geek, abonnez-vous sur Google News. Et si vous nous aimez, nous avons une newsletter tous les matins.

For Latest Updates Follow us on Google News

Une percée, pas une révolution

Related posts