Nvidia booste l’IA locale sur PC avec ses puces graphiques RTX

Nvidia booste l’IA locale sur PC avec ses puces graphiques RTX
Nvidia booste l’IA locale sur PC avec ses puces graphiques RTX

Nvidia ne compte pas laisser la vedette à Microsoft et Qualcomm pour l’IA sur PC. Le constructeur américain compte démontrer la puissance de ses puces graphiques RTX avec un nouveau driver qui améliore drastiquement leurs performances dans les applications locales d’IA.

Le monde du PC est en pleine tourmente ces derniers jours, suite aux récentes annonces de Microsoft qui inaugurent l’ère des « AI PC », sous l’égide de son nouveau label Copilot+. Ces nouveaux types d’ordinateurs personnels, qui intègrent une multitude de services et de fonctions d’intelligence artificielle au cœur même du système d’exploitation, promettent de révolutionner la façon dont nous utilisons et interagissons avec nos PC. Et que vous soyez un passionné précoce, un sceptique endurci ou simplement un curieux, la diversité des cas d’usage présentés par Microsoft ne peut vous laisser indifférent.

Pour initier cette révolution, la firme de Redmond a décidé de s’appuyer en premier lieu sur de tout nouveaux processeurs, conçus par l’américain Qualcomm, les Snapdragon X Elite et X Plus. Ces puces présentent deux caractéristiques majeures : elles sont conçues selon une architecture Arm, en lieu et place du vénérable x86, et elles contiennent une unité spécialisée dans les opérations liées à iA, le fameux NPU (Neural Processing Unit ou Processing Unit neuronal, en français), capable d’offrir une puissance de calcul de 45 TOPS, un niveau jamais atteint jusqu’à présent pour un processeur de type tout-en-un (system-on-chip, ou SoC pour system-on-chip).

Avec ses annonces et le lancement des PC Copilot+, Microsoft propage donc l’idée que l’intelligence artificielle est étroitement liée à Qualcomm, Arm et NPU, du moins dans l’écosystème Windows. Ce ne sont cependant pas les seuls acteurs ni les seules technologies capables d’offrir des performances élevées en matière d’intelligence artificielle. Il faut aussi prendre en compte Nvidia, qui conçoit et commercialise, depuis des années et bien avant d’autres, des composants particulièrement efficaces en la matière, à travers sa plateforme RTX, qui désigne à la fois les cartes graphiques éponymes bien connues des gamers, géantes, super- des processeurs puissants pour les serveurs et un ensemble d’outils logiciels pour le développement.

Nvidia R555 Game Ready : un nouveau driver pour booster l’exécution locale des fonctions d’IA

C’est le nouveau nerf de la guerre à l’ère des PC IA qui s’ouvre. Maintenant que le grand public a découvert et adopté, au moins en partie, les outils d’IA générative, il est temps de déplacer ces services du cloud vers les machines des utilisateurs. C’est tout l’objet du label PC Copilot+ et des processeurs Snapdragon X Series équipés de NPU suralimentés. Mais Nvidia, qui s’est imposé comme le champion actuel en matière de composants matériels dédiés à l’IA, ne semble pas vouloir rester en retrait dans cette transition et compte bien revenir sur le devant de la scène.

Dans le cadre de la conférence annuelle de Microsoft dédiée aux développeurs, Microsoft Build, le constructeur vient d’annoncer la sortie du pilote Nvidia Game Ready R555 pour ses cartes graphiques RTX, avec des promesses de gains de performances très significatifs liés à l’IA, que ce soit pour les développeurs ou les utilisateurs. : « Grands modèles de langage (LLM) […] travaillez désormais jusqu’à trois fois plus vite […] en utilisant le nouveau pilote NVIDIA R555 Game Ready.

Pour offrir ce niveau de performances, le nouveau driver prend en charge deux composants logiciels, ONNX Runtime et DirectML, dont la fonction est double : accélérer la chaîne de traitement des opérations iA en confiant le maximum de calculs au GPU plutôt qu’au CPU (ONNX Runtime ) et permettent que le GPU soit vu comme une sorte de NPU par le système d’exploitation (DirectML), afin que toutes les applications d’IA puissent l’adresser directement, sans nécessiter une implémentation spécifique des technologies RTX par les développeurs.

L’objectif de ce driver est donc à la fois d’augmenter drastiquement les performances en termes d’exécution locale de l’IA et de rendre la puissance de calcul du GPU beaucoup plus accessible aux développeurs et aux applications. Pour étayer ses affirmations, Nvidia publie un petit graphique montrant les gains de performances obtenus sur l’inférence (exécution, par opposition à l’entraînement) de trois Large Language Models (LLM), avec le nouveau pilote R555 par rapport au précédent. Les progrès semblent en effet impressionnants, même si les mesures sont réalisées sur un GPU RTX 4090, une carte haut de gamme extrêmement chère et peu courante.

En gardant à l’esprit que ces chiffres sont donnés par l’entreprise elle-même et qu’il faudra donc vérifier ces résultats en situation réelle, avec différents modèles de circuits RTX et applications d’IA s’appuyant sur différents LLM, cette communication confirme au moins une chose : Nvidia ne veut pas se contenter d’être présent dans le domaine des serveurs et de la formation de modèles d’IA, mais souhaite s’imposer comme un acteur incontournable sur l’aspect exécution des services d’IA locaux, directement sur les machines des utilisateurs.

Les circuits RTX proposent déjà, et depuis plusieurs années, de nombreuses applications concrètes basées sur l’IA. Dans les jeux vidéo par exemple, le DLSS regroupe un ensemble de techniques de mise à l’échelle, de génération d’images et d’amélioration du rendu graphique basées sur le machine learning (l’apprentissage en profondeur). Lancée plus récemment, la technologie Nvidia ACE utilise les Large Language Models (LLM) pour générer des dialogues interactifs en temps réel avec des personnages non-joueurs dans les jeux. Côté création, les puces RTX accélèrent de nombreux outils d’IA dans des applications très populaires comme Adobe Premiere, DaVinci Resolve ou Blender. Et l’application Nvidia Broadcast offre de nombreux traitements audio et vidéo en temps réel – et même des effets époustouflants – sur les PC équipés d’une puce RTX.

Il existe donc déjà de nombreuses utilisations concrètes de l’IA dans l’écosystème RTX, apparaissant bien avant l’engouement général pour l’IA générative, et le nouveau driver Game Ready R555 viendra donc encore améliorer leur fonctionnement. C’est une perspective intéressante, car les puces de Nvidia seront capables de dynamiser un large éventail d’applications d’intelligence artificielle, au-delà de celles intégrées à Windows avec Copilot+. Il faut espérer que les éditeurs et les développeurs s’empareront de ces outils pour exploiter la puissance des puces RTX dans de nouvelles fonctions basées sur l’IA, dans le domaine du gaming, comme dans les applications de création professionnelle, en graphisme, en 3D, en audio et vidéo.

IA avec RTX : plus puissante que les PC Copilot+ ?

En fait, les puces graphiques Nvidia RTX offrent des niveaux de performances d’inférence IA bien supérieurs à ceux des processeurs équipés de NPU, qu’il s’agisse de la série Qualcomm Snapdragon X ou des prochains Intel Lunar Lake et AMD Strix. Pour avoir une idée de cette différence, l’Intel Core Ultra actuel atteint une puissance maximale de 34 000 milliards d’opérations par seconde (TOPS) et les Snapdragon X Elite et X Plus, 45 TOPS, où un RTX GPU 4050 en version ordinateur portable, le le plus petit modèle de la gamme, atteint déjà 194 TOPS. Et quant à la monstrueuse RTX 4090 en version desktop, elle s’envole jusqu’à 1 300 TOPS !

Ces scores impressionnants sont donc bien supérieurs à l’exigence minimale de 40 TOPS fixée par Microsoft pour prétendre au titre de PC Copilot+. Cependant, cette puissance excessive n’est pas sans compensation et elle se fait au prix d’une consommation énergétique bien supérieure à celle des processeurs équipés d’un simple NPU. Et cet écart d’efficacité énergétique se creuse encore avec les Snapdragon X Series, des puces sous architectures Arm dont la principale caractéristique est justement leur très faible consommation énergétique.

Si la puissance de calcul des GPU RTX de Nvidia leur permet donc d’aborder sans problème les applications d’IA les plus lourdes et les plus exigeantes, leur consommation électrique n’en fait pas pour autant les meilleurs candidats dans le secteur des PC portables, dans lequel l’efficacité énergétique est un facteur tout aussi important que pouvoir.

© NVIDIA

Un aspect que Microsoft semble avoir en tête dans la définition de son label Copilot+ pour PC, et l’une des raisons pour lesquelles l’entreprise réserve pour le moment ce nom uniquement aux machines équipées d’un processeur Snapdragon X Series, comme le dit cette déclaration. dans l’annonce de lundi dernier : « Les premiers PC Copilot+ seront lancés avec Snapdragon X Elite et Snapdragon ».

Toutefois, le cabinet ajoute dans le paragraphe suivant : « De nouvelles expériences Copilot+ PC seront bientôt publiées. De nouveaux appareils équipés de ce processeur associé à des cartes graphiques puissantes comme NVIDIA GeForce RTX et AMD Radeon seront bientôt disponibles, rendant les PC Copilot+ accessibles à un public encore plus large. On comprend donc très bien que le périmètre des PC labellisés Copilot+ est amené à évoluer, et que les machines équipées de cartes graphiques Nvidia RTX pourraient obtenir le fameux sésame, à condition d’être associées à un processeur central économe en énergie.

Si les GPU RTX de Nvidia disposent donc d’une puissance de calcul suffisante pour exécuter localement les fonctions Copilot+ AI, l’obtention du label lui-même échappe à son contrôle et dépend entièrement de Microsoft, pour des considérations certainement plus politiques. et commercial plutôt que véritablement technique.

Mais l’idée à retenir est la suivante : si vous êtes intéressé par les nouveaux usages de l’IA, vous possédez un ordinateur équipé d’une carte graphique Nvidia RTX et les annonces de Microsoft autour des PC Copilot+ vous ont plongé dans le doute, rassurez-vous. Votre PC est loin d’être obsolète et il n’est pas nécessaire de s’épuiser et d’acheter un tout nouvel ordinateur équipé d’un processeur doté d’un NPU pour utiliser localement de nouvelles applications d’IA générative. Si l’attention médiatique se porte actuellement sur certains termes comme Arm et NPU, il existe d’autres pistes technologiques tout aussi sérieuses et pertinentes pour propulser ces nouveaux usages et accompagner la transformation en cours de l’informatique personnelle.

 
For Latest Updates Follow us on Google News
 

NEXT Une Maison des Vins à La Havane