Si les incroyables progrès réalisés dans le domaine de l’intelligence artificielle vous font peur, asseyez-vous avant de lire les informations qui suivent. Le 20 décembre, le système o3 d’OpenAI a obtenu un score de 85 % au test ARC-AGI, l’évaluation de référence en matière d’intelligence. Jusqu’alors, l’IA n’avait jamais franchi la barre des 55 % ; en battant largement son record, elle se situe désormais dans la moyenne des résultats obtenus par les humains.
Pour OpenAI, il s’agit d’une étape supplémentaire vers la création d’une intelligence artificielle généraliste, un objectif affiché par tous les grands laboratoires de recherche du secteur. Mais en est-on encore loin, se demande The Conversation ?
Abonnez-vous gratuitement à la newsletter korii !Ne manquez aucun article korii grâce à cette sélection quotidienne, directement dans votre boîte mail.
Chaînes de pensée
Revenons au test ARC-AGI : c’est un test de l’efficacité d’échantillonnage d’un système d’IA face à quelque chose de nouveau, c’est-à-dire le nombre d’exemples d’une situation nouvelle que le système doit voir pour comprendre comment il travaux. A titre d’exemple, ChatGPT (GPT-4) n’est pas très efficace en matière d’échantillonnage. Il a été formé sur des millions d’exemples de textes humains, construisant des règles probabilistes basées sur les combinaisons de mots les plus probables.
En revanche, le modèle o3 développé par OpenAI semble désormais très adaptable : à partir d’une poignée d’exemples, il parvient à comprendre et formuler des règles de fonctionnement. La communauté scientifique s’interroge : comment a procédé l’entreprise américaine ? Chercheur en intelligence artificielle et concepteur de tests, François Chollet a sa propre idée.
L’expert estime qu’o3 recherche différents « chaînes de pensée » décrivant les étapes à suivre pour résoudre la tâche, pour ensuite choisir la “meilleur” selon une règle vaguement définie, ou “heuristique”. Ce ne serait pas si différent de la façon dont le système AlphaGo de Google recherchait différentes séquences de mouvements possibles afin de battre le champion du monde de go Lee Sedol.
Si l’hypothèse du chercheur français est correcte, alors The Conversation estime que le chemin vers l’intelligence artificielle générale pourrait encore être long : cela signifierait en effet que le modèle qui a obtenu le score de 85% n’est finalement pas beaucoup plus performant que les précédents. Mais tout cela n’est que conditionnel : OpenAI s’est une nouvelle fois limité à quelques présentations médiatiques et tests préliminaires auprès d’une poignée de chercheurs, laboratoires et institutions de sécurité de l’IA.
L’impatience est grande : de nombreux experts aimeraient pouvoir regarder ce qu’o3 a sous le capot et comprendre son fonctionnement. Son évolution pourrait en effet avoir un impact économique énorme et révolutionnaire, ouvrant la voie à une nouvelle ère d’intelligence accélérée et auto-améliorée. Mais en raison de la prudence d’OpenAI, il est encore trop tôt pour savoir si la date du 20 décembre 2024 constituera une étape importante.