Qu’est-ce que gpt2-chatbot, le mystérieux modèle de langage que certains associent à GPT-5 ? – .

Apparu mystérieusement sur un site de comparaison de grands modèles de langage, le modèle gpt2-chatbot intrigue la communauté de l’intelligence artificielle (IA). Soi-disant capable de résoudre des problèmes inabordables pour GPT-4, il pourrait s’agir d’un prototype d’un futur modèle OpenAI. Sam Altman, le patron de l’entreprise, ne cache pas amusement.

OpenAI est-il sur le point de faire une annonce majeure ? Historiquement, la marque a toujours aimé dévoiler des nouveautés en même temps que ses concurrents, pour voler la vedette. La Google I/O du 14 mai et la Apple WWDC du 10 juin sont des cibles parfaites pour le groupe de Sam Altman : celui-ci pourrait se laisser tenter par la sortie d’un nouveau modèle de langage pour contrer les annonces IA de ses concurrents. Reste à savoir si GPT-5, GPT-4.5, Sora, Q-Star ou autre seront prêts à temps.

En attendant, un mystérieux modèle de langage fait beaucoup parler depuis le 29 avril. Apparu sur le comparateur de chatbot LMSYS, gpt2-chatbot est présenté par certains observateurs comme le successeur potentiel de GPT-4, ou du moins une version dérivée. Sam Altman, le patron d’OpenAI, s’est même amusé à tweeter qu’il avait “un faible pour gpt2”, soulignant l’absence de trait d’union. Il a explicitement modifié son tweet pour supprimer toute ressemblance avec GPT-2, le prédécesseur de GPT-4, sorti en 2019. Que cache ce fameux gpt2-chatbot ?

type="image/avif"> type="image/webp">>>
Dans un tweet édité, Sam Altman entretient la rumeur gpt2. Il a délibérément supprimé le trait d’union pour accroître les soupçons. // Source : https://twitter.com/sama/status/1785107943664566556

gpt2 ou GPT-2 : un tiret très important

Pourquoi supprimer le trait d’union ? L’acronyme GPT signifie « Generative Pre-training Transformer », qui correspond au mécanisme qui permet de lire du texte et de le créer, après un entraînement avec des milliards de documents. GPT-4, avec trait d’union, est la quatrième itération de la « machine » GPT. Compte tenu de l’absence de trait d’union entre le sigle et le numéro de gpt2-chatbot, on peut supposer qu’il ne s’agit pas du modèle GPT-2 sorti en 2019, et désormais daté.

Avec son tweet modifié, Sam Altman met de facto l’accent sur un nom gpt2 dont l’orthographe est significative. Certains supposent une seconde version du mécanisme de transformation OpenAI, reconstruit ou remodelé pour l’occasion, même si rien ne permet de le confirmer. D’autres soutiennent que cet acronyme gpt2-chatbot serait l’équivalent d’un éventuel GPT2-1, ce qui signifierait que GPT-5 en tant que suite logique de GPT-4 n’existerait pas.

type="image/avif"> type="image/webp">>>Sur Twitter et Reddit, de nombreux comptes spéculent sur gpt2-chatbot. Le tweet de Sam Altman n'a fait que renforcer les doutes.
Sur Twitter et Reddit, de nombreux comptes spéculent sur gpt2-chatbot. Le tweet de Sam Altman n’a fait que renforcer les doutes. // Source : https://twitter.com/itsandrewgao/status/1785013026636357942

Gpt2-chatbot est-il une révolution… ou une arnaque ?

Qui a créé le chatbot gpt2 ? Pour le savoir, quoi de mieux que de lui poser la question.

Le chatbot est entraîné pour dire qu’il s’agit de ChatGPT et qu’il est basé sur GPT-4, ce qui veut dire tout et rien à la fois. Son créateur, volontairement ou involontairement, peut lui avoir demandé de répondre qu’il a été créé par OpenAI lorsqu’on lui a demandé. À l’inverse, OpenAI peut forcer un modèle de langage expérimental à usurper l’identité de GPT-4 pour masquer son vrai nom. Seule certitude : le modèle gpt2-chatbot partage les mêmes faiblesses que les autres modèles OpenAI, ce qui laisse penser que l’entreprise américaine se cache derrière sa création.

type="image/avif"> type="image/webp">Pour certains spécialistes, gpt2-chatbot est plus intelligent que GPT-4.>>Pour certains spécialistes, gpt2-chatbot est plus intelligent que GPT-4.
Pour certains spécialistes, gpt2-chatbot est plus intelligent que GPT-4. // Source : https://twitter.com/ChaseMc67/status/1785004897341202528

Lorsque vous parcourez Twitter, vous pouvez lire diverses critiques sur gpt2-chatbot. Il est présenté comme un chatbot incroyablement doué en programmation et en mathématiques. Il est également décrit comme une version allégée de GPT-4… Plusieurs théories émergent et vont d’un futur modèle révolutionnaire de GPT-5 à une version open Source de GPT-4, en passant par une version plus évoluée du mécanisme derrière ChatGPT.

Dans l’état actuel des choses, il est difficile de commenter ce qu’est précisément gpt2-chatbot ; il a, dans l’état actuel des choses, autant de chances d’être la prochaine grande itération d’OpenAI qu’une imitation open Source. Ce mystérieux chatbot est actuellement limité à 8 interactions par utilisateur, avec un quota fixé à 1 000 par heure à l’échelle de son serveur. C’est faible.

type="image/avif"> type="image/webp">Capture d'écran 2024-04-30 au 11.04.48>>Capture d'écran 2024-04-30 au 11.04.48
Sur LMSYS, vous pouvez discuter avec gpt2-chatbot. // Source : LMSYS

Si Sam Altman n’avait pas écrit son tweet énigmatique, gpt2-chatbot pourrait être considéré comme trop vague pour être pris au sérieux. La publication du patron d’OpenAI incite cependant à s’y attarder. En tout cas, cela laisse penser qu’une annonce est imminente. Reste à savoir s’il s’agit bien d’une deuxième version de la machine GPT, d’un nouveau modèle de type GPT-4.5/GPT-5, d’un nouveau projet, ou d’un mirage.


Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux vélos électriques ? Abonnez-vous maintenant à notre newsletter Watt Else !

 
For Latest Updates Follow us on Google News
 

PREV CdF – Journée de finales inédites à l’adidas Arena de Paris
NEXT Au Niger, une entreprise chinoise va reprendre l’exploitation de l’uranium après dix ans d’interruption