Capable de résoudre des problèmes complexes grâce à une capacité de réflexion similaire à celle de plusieurs êtres humains, o3 est présenté par OpenAI comme la dernière étape avant l’intelligence artificielle générale. Problème : le coût d’une demande fait exploser tous les records.
Annoncé le 20 décembre 2024 en conclusion de 12 jours d’annonces OpenAI, le modèle o3 pourrait bien être la prochaine grande révolution du créateur de ChatGPT. Ce modèle de pointe, conçu pour reproduire le fonctionnement du cerveau humain, excelle dans les tests mathématiques comme aucune autre intelligence artificielle auparavant.
Il pourrait un jour résoudre des énigmes trop complexes pour les humains en « réfléchissant » plusieurs minutes et en croisant simultanément plusieurs milliards de données. Sam Altman l’appelle « AGI-1 » (en référence à « l’intelligence générale artificielle »), ce qui laisse penser que son rêve d’intelligence générale artificielle n’est pas loin.
Malheureusement, cette super-IA a un défaut : elle coûte une fortune. Arc Prize, une organisation qui développe des outils pour tester les progrès de l’IA, a eu accès aux premières versions pour réaliser des benchmarks. Le 20 décembre, elle a révélé les détails des nouveaux modèles OpenAI. On découvre que le coût d’une demande vers la meilleure version d’o3 dépasse facilement les 1 500 dollars.
La version la plus puissante d’o3 pourrait ne jamais sortir
Le modèle o3 sera-t-il un jour disponible dans ChatGPT ? Peut-être, mais probablement pas sous sa forme la plus efficace.
Selon Arc Prize, une requête à o1-mini coûte aujourd’hui une vingtaine de centimes quand o1, dans sa version la plus chère, coûte environ 5 dollars par question. o3 peut coûter entre 17 et 20 dollars (version restreinte) ou… environ 1 600 dollars (version hautes performances). A un tel prix, la cible o3 n’est plus la même : le modèle est destiné aux chercheurs, pas au grand public.
La première version d’o3 testée par Arc Prize, celle à 17-20$, comporte six itérations de calcul. Il peut répondre à 75,7 % des questions les plus complexes, quand GPT-4o était limité à 5 %. La version boostée, à 1 600 $, utilise 1 024 itérations. OpenAI bat alors son propre record avec 87,5% de bonnes réponses.
A un tel prix, l’humain coûte désormais moins cher que l’o3 (y compris sa version la moins chère). François Chollet, le chercheur signataire de l’article, conclut que les progrès technologiques sont spectaculaires, mais que le prix pose encore de gros défis à OpenAI. Il est peu probable que la version boostée d’o3 soit accessible ailleurs que dans les benchmarks.
D’ailleurs, Arc Prize n’est pas d’accord avec l’idée d’une AGI imminente. Son test ARC-AGI sera bientôt mis à jour et devrait faire baisser le score des modèles comme ceux d’OpenAI. o3 répond bien aux exigences des tests aujourd’hui, mais pourrait échouer avec plus de complexité.
On comprend mieux pourquoi Sam Altman s’appuie autant sur o3-mini
Lors de la présentation de o3, Sam Altman a insisté sur l’existence de trois versions de o3-mini qui, selon lui, étaient meilleures que o1. Une affirmation qui prend tout son sens aujourd’hui, compte tenu des tarifs du nouveau modèle frontière. Il est probable que o3-mini deviendra le nouveau produit phare de ChatGPT, et non o3.
Autre hypothèse : o3 sera-t-il réservé à ChatGPT Pro, le nouvel abonnement à 200$ par mois ? Ce prix aurait du sens pour des demandes à 20 dollars pour la version restreinte.