OpenAI O3 bat tous les records ! Un pas en avant vers l’AGI ?

Rédaction du RHC : 26 décembre 2024 08:53

Le 20 décembre, le nouveau système d’intelligence artificielle d’OpenAI, o3, a franchi une étape majeure. Le modèle a obtenu une note 85 % au test de réflexion ARC-AGI, qui est le même que le score humain moyen. En plus de cela, il excellait dans les problèmes mathématiques complexes.

Le test ARC-AGI et la logique d’échantillonnage

Jusqu’à présent, le meilleur résultat parmi des développements similaires n’a pas dépassé 55 %. De nombreux chercheurs pensent que o3 a franchi une étape importante vers l’intelligence générale artificielle (AGI), même si les sceptiques doutent encore de la signification de ce résultat.

Ici, il est important de comprendre les caractéristiques du test ARC-AGI. L’indicateur principal est “efficacité d’échantillonnage”, ou le capacité à s’adapter à de nouvelles conditions, en ayant un minimum d’exemples. En termes simples, le test détermine combien d’échantillons d’une nouvelle situation sont nécessaires pour comprendre son fonctionnement.

Les modèles de langage modernes tels que ChatGPT basés sur GPT-4 ne peuvent pas se vanter d’une efficacité d’échantillonnage élevée. Au cours de la formation, ils examinent des millions de fragments de textes humains et, sur cette base, en déduisent les combinaisons de mots les plus probables. Cette méthode permet de faire face à des tâches typiques, mais échoue dans des situations non standard, simplement parce qu’il n’y a pas suffisamment d’exemples similaires dans la base de données.

Pour l’instant, l’IA ne peut être utilisée que là où les tâches sont répétées ou là où les erreurs aléatoires n’entraînent pas de conséquences graves. Le principal problème est que les modèles ne savent pas comment apprendre rapidement et s’adapter aux nouvelles circonstances.

C’est une question de « généralisation »

La capacité de trouver des solutions correctes à des problèmes inconnus sur la base d’un ensemble limité d’informations est appelée généralisation par les scientifiques. Dans la communauté scientifique, ce trait est considéré comme un signe nécessaire et fondamental de l’intelligence. L’ARC-AGI se compose de problèmes à grille carrée similaires aux tests de QI scolaires. Deux images apparaissent à l’écran : le motif initial et un exemple de l’état auquel il doit arriver après certaines manipulations. Le programme doit ccomprendre le modèle de transformation de l’état initial en état final.

Chaque activité est accompagnée de trois exemples pédagogiques. Après les avoir étudiés, l’algorithme doit dériver les règles et les appliquer dans la pratique. Cette approche vous permet de vérifier à quelle vitesse l’adaptation se produit.

Lors de la recherche de modèles, il est important de ne pas faire d’hypothèses inutiles ni d’entrer dans des détails inutiles. En théorie, si vous parvenez à trouver les règles les plus simples et suffisantes pour trouver une solution, le programme pourra mieux s’adapter aux nouvelles situations.

Le “des règles simples” ils peuvent généralement être décrits par des phrases courtes. Par exemple, dans un problème avec une grille de carrés, la règle pourrait être : “La figure avec la ligne saillante se déplacera jusqu’à la fin de cette ligne et couvrira toutes les figures sur son passage.”

Le fonctionnement exact de o3 est encore inconnu, mais il est peu probable qu’on vous ait spécifiquement appris à le rechercher. « des règles simples ». OpenAI a pris comme base une version générique du modèle capable de réfléchir plus longtemps à des questions complexes, puis l’a entraîné davantage pour réussir le test ARC-AGI.

O3 fonctionne à travers des chaînes de raisonnement

Le chercheur français en IA François Chollet, qui a créé le test, suggère que o3 parcourt différentes « chaînes de raisonnement » ou séquences d’étapes pour atteindre un objectif. Ensuite, la meilleure option est sélectionnée sur la base de certaines suggestions de règles.

Cependant, il est trop tôt pour dire à quel point cela nous rapproche de la création d’AGI. Les mécanismes de base pour travailler avec la langue peuvent rester les mêmes, sauf qu’ils sont désormais plus efficacement adaptés pour résoudre un type spécifique de problème.

OpenAI garde secrètes presque toutes les informations sur son développement. L’entreprise s’est limitée à quelques présentations médiatiques et a permis à o3 d’être testé uniquement par certains chercheurs, laboratoires et organisations travaillant sur la sécurité de l’IA.

Équipe éditoriale
L’équipe éditoriale de Red Hot Cyber ​​​​est composée d’un groupe d’individus et de sources anonymes qui collaborent activement en fournissant des informations en avant-première et des actualités sur la cybersécurité et l’informatique en général.
 
For Latest Updates Follow us on Google News
 

PREV Vivek Ramaswamy soumet une demande d’ETF Bitcoin Bond qui suit le marché des titres convertibles de MicroStrategy
NEXT enquête sur des soupçons de harcèlement de témoins contre l’épouse du Premier ministre