une IA surhumaine, mais chaque réponse coûte 6 000 $

Tuesday 24th December 2024 08:13 AM

OpenAI dévoile o3 ! Cette nouvelle IA qui succède à o1 est capable de reproduire la façon dont les humains raisonnent, afin de fournir des réponses plus profondes et plus complexes aux questions et autres invites. Découvrez son fonctionnement et ses capacités impressionnantes !

Ce vendredi 20 décembre, pour le dernier des 12 jours d’annonces de son « Shipmas », OpenAI a créé la surprise en révélant ses prochains modèles d’IA capables de raisonner.

Successeur de o1, qui vient de sortir en version complète après une avant-première début 2024, ce sont o3 et o3-mini.

o3, le successeur de o1 qui explose les benchmarks

Grâce à un nouveau processus de « chaîne de pensée privée » (chaîne de pensée privée), ces schémas s’interrompent les uns les autres pour examiner leur dialogue interne et planifiez avant de répondre.

C’est un « raisonnement simulé »allant au-delà des simples prédictions de mots des grands modèles de langage (LLM) comme GPT-4.

Selon OpenAI, o3 a battu des records sur le Benchmark de raisonnement visuel ARC-AGI. Il a obtenu un score de 75,7 % dans des scénarios de faible consommation, et 87,5% à puissance élevée. En comparaison, les humains n’atteignent que 85%.

De plus, le modèle a atteint un score de 96,7% sur le Examen américain de mathématiques sur invitation de 2024. Il n’a manqué qu’une seule question !

Concernant le GPQA Test de biologie, physique et chimie du diamanto3 a obtenu un score de 87,7 %. Il a également résolu 25,2% des problèmes sur le benchmark EpochAI Frontier Math. Aucun l’autre modèle avait dépassé 2 %…

Le président de la Fondation Prix ARC lui-même s’est exprimé lors de la diffusion en direct pour affirmer que « en voyant ces résultats, Je dois changer ma vision du monde sur ce que l’IA peut faire et de quoi elle est capable ».

Un coût totalement disproportionné

Certains experts estiment déjà queo3 est tellement efficace qu’on peut le considérer comme le premier AGI supérieure à l’intelligence humaine.

Cependant, son le gros problème actuel c’est son coût. Chaque réponse à une invite coûte entre 30 $ et 6 000 $ ! Pour le faire passer un examen de mathématiques et la physique, OpenAI a dépensé 350 000 $…

Mais où est passé l’o2 ?

Vous vous demandez peut-être pourquoi OpenAI est passé directement de o1 à o3. En réalité, l’entreprise souhaite simplement éviter les conflits autour de la marque déposée avec l’opérateur téléphonique britannique O2.

En plus, Le PDG Sam Altman a plaisanté lors de l’annonce expliquant que cette IA s’appelle o3” dans le grande tradition d’OpenAI être vraiment, vraiment mauvais avec les noms ».

o3-mini : une petite IA capable d’adapter sa vitesse

De son côté, o3-mini a une fonctionnalité de pensée temporelle adaptative ce qui lui permet de varier un vitesse de traitement faible, moyenne ou élevée.

Malgré sa petite taille, cette variante miniature surpasse son prédécesseur o1 sur le benchmark Codeforces. Des réglages de puissance plus élevés produisent de meilleurs résultats.

Le raisonnement, prochaine étape majeure de l’évolution de l’IA ?

Cette annonce d’OpenAI intervient à un moment où d’autres entreprises développent leurs propres modèles de raisonnement. C’est le cas de Googlequi vient de dévoiler Gemini 2.0 Flash Thinking Experimental.

En novembre 2024, DeepSeek a introduit DeepSeek-R1. Citons aussi le géant chinois Alibaba et son modèle QwQ ouvert.

Ces nouveaux modèles d’IA sont basés sur les LLM traditionnels, mais sont ajustés pour suivre un chaîne de processus de pensée capable de considérer ses propres résultats pour simuler le raisonnement.

Celui-ci peut-être prolongé du temps d’exécutionplutôt que de se concentrer sur améliorations lors de la formation du modèle.

Cette approche a été utilisé pour les LLM comme GPT-4mais apporte de moins en moins d’améliorations depuis un certain temps.

Et le plafond semble avoir été atteintnotamment à cause du pénurie de données générées par l’homme avec lequel nourrir l’IA.

Comment tester OpenAI o3 ?

Ces nouveaux modèles seront mis à disposition pour la première fois aux chercheurspour qu’ils puissent les tester. Dans un premier temps, OpenAI a l’intention de lancer o3-mini fin janvier 2025, puis o3 peu après.

Il faudra donc attendre pour pouvoir mettre la main sur ces IA et tester leurs capacités. je pense personnellement qu’un modèle capable de réflexion est bien plus utile qu’un simple LLM comme GPT !

Et vous, qu’en pensez-vous ? Utilisez-vous o1 ? Pensez-vous que la simulation du raisonnement est la voie à suivre pour continuer à améliorer l’intelligence artificielle ? Partagez votre avis dans les commentaires !

Partagez l’article :

Facebook

Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons gagner une commission d’affiliation.

For Latest Updates Follow us on Google News