comparaison des nouveaux modèles d’IA

comparaison des nouveaux modèles d’IA
comparaison des nouveaux modèles d’IA

La semaine dernière, OpenAI et Google ont annoncé des mises à jour de leurs modèles d’IA générative respectifs, GPT-4o et Gemini 1.5 Pro, avec de nouvelles interfaces et fonctionnalités. Il n’est pas toujours facile de comprendre les distinctions entre ces modèles, non seulement entre ChatGPT d’OpenAI et Gemini de Google, mais aussi entre tous leurs concurrents.

Les différences existent bel et bien et la meilleure manière de les illustrer est de comparer ces derniers modèles. Pour cela, nos confrères de CNET.com ont contacté un expert de la Silicon Valley qui a tenu à rester anonyme car il n’est pas autorisé à s’exprimer publiquement.

Dans ma tête, c’est comme du Coca et du Pepsi. Tu vois ce que je veux dire ? il a dit à propos de GPT-4o et Gemini 1.5 Pro.

Le Coca et le Pepsi sont tous deux des colas, mais ils sont préparés avec des formules différentes et, comme tout fan de ces boissons vous le dira, ils n’ont pas le même goût. GPT-4o et Gemini 1.5 Pro sont des modèles de langage avancés, conçus pour comprendre les requêtes et générer des réponses qui semblent avoir été écrites par un humain. Mais les réponses de ChatGPT ne ressemblent pas exactement à celles de Gemini. Ce sont les mêmes, mais différents.

GPT-4o est conçu pour s’intégrer aux produits Microsoft, mais fonctionne également de manière autonome. Gemini 1.5 Pro est conçu pour Google.

Les deux modèles proposent des versions et des abonnements gratuits. ChatGPT Plus et Gemini Advanced coûtent chacun 20 $ par mois et donnent accès aux derniers modèles et à davantage de fonctionnalités.

Et tout comme on peut préférer le goût d’un cola à celui d’un autre, c’est bien à l’utilisateur de faire son choix entre ces deux IA génératives, en fonction de ses besoins et préférences. Voici un aperçu plus approfondi des performances de GPT-4o et Gemini 1.5 Pro.

Fenêtres contextuelles

La semaine dernière, Google a annoncé que Gemini 1.5 Pro s’étendait à un million de jetons, avec la promesse de doubler pour atteindre 2 millions de jetons plus tard cette année. (Il a été lancé avec un pop-up de 128 000 jetons en février). GPT-4o et les anciens GPT-4, en revanche, ont 128 000 fenêtres contextuelles de jetons. Qu’est-ce que cela signifie ?

La fenêtre pop-up est la partie de texte qu’un modèle de langage peut prendre en compte pour générer une réponse, un peu comme sa mémoire. Plus la fenêtre contextuelle est grande, plus le modèle peut se souvenir des conversations passées, ou plus il peut ingérer de mots, de vidéos, de sons ou de lignes de code qui lui sont présentés. Gemini a donc beaucoup plus de capacité à ce stade.

Mais quand il s’agit de paramètres…

Ni OpenAI ni Google n’ont grand chose à dire sur les paramètres. De quoi s’agit-il ?

Tout d’abord, un petit rappel concernant les tokens ou tokens. Les grands modèles de langage divisent les requêtes en jetons afin de les traiter et de fournir des réponses. Les jetons peuvent être aussi courts qu’un caractère ou aussi longs qu’un mot. Ainsi, dans l’exemple « Bonjour lecteur », un jeton pourrait être « bonjour » et l’autre « lecteur ». Les paramètres déterminent la capacité du modèle à traiter ces jetons et à générer du texte avec précision.

Nous pouvons également considérer les paramètres comme les neurones du cerveau. Plus il y a de neurones, plus les pensées peuvent être complexes. Il en va de même pour les paramètres.

Google n’a pas divulgué publiquement les paramètres de ses modèles. Les estimations varient entre 1 600 milliards et 175 000 milliards de paramètres.

Le nombre de paramètres utilisés par GPT-4o n’est pas non plus connu. Mais Mira Murati, CTO d’OpenAI, a déclaré que le modèle « apporte une intelligence de niveau GPT-4 à tout « . GPT-4, créé en mars 2023, utiliserait 1 800 milliards de paramètres.

Accès à l’information

Les principaux modèles de langage ont des seuils de connaissances. En d’autres termes, leurs données d’entraînement ne contiennent des informations que jusqu’à un certain moment. Pour GPT-4o, le seuil de connaissance est fixé à octobre 2023. Pour les Gémeaux, il est « début 2023 ».

Outre le fait que son outil s’entraîne sur des données plus récentes, OpenAI a signé des accords avec la plateforme sociale Reddit et le groupe audiovisuel News Corp pour accéder à des contenus plus actuels.

LANGUES

GPT-4o est disponible en 50 langues. Gemini 1.5 Pro est disponible en 35 langues.

Cependant, compte tenu des 18 années d’expérience de Google Translate, Google dispose potentiellement de beaucoup plus de données pour former ses modèles aux capacités multilingues.

Interfaces

Une dernière similitude : les deux modèles ont récemment introduit des fonctionnalités pour devenir plus conversationnels. Pour ChatGPT-4o, il s’agit d’une nouvelle interface qui permet de parler au chatbot ou de partager des séquences vidéo en direct. (Il utilise l’expression « Hé, ChatGPT »). Vous pouvez interrompre le modèle et il peut même ressentir vos émotions.

De son côté, Google vient de lancer Gemini Live, qui permet de discuter avec l’IA. Vous pouvez également interrompre Gemini Live.

Lire aussi

 
For Latest Updates Follow us on Google News
 

PREV Fujifilm a l’appareil photo parfait pour vos vacances avec son Instax Wide 400
NEXT Nike contre Adidas ? Quelle paire de chaussures de running choisir ? – .