Pour comprendre l’intérêt de ce nouveau projet, rappelons qu’il s’agit d’une architecture appelée « Grace Blackwell », embarquant jusqu’à 20 cœurs CPU basés sur une architecture ARM et un GPU interne de pointe équipé de cœurs Tensor de cinquième génération. Autrement dit, le système prend en charge de grands modèles d’IA, potentiellement jusqu’à 200 milliards de paramètres sur une seule unité. C’est un pas de géant pour ceux qui souhaitent développer ou ajuster des modèles de langage de type LLM (Large Language Model) sans avoir à louer de fermes de serveurs.
Le résultat ? Un boitier qui ressemble à un mini-ordinateur, toujours enfichable sur une prise standard, sans nécessiter un système de refroidissement monstrueux. Lors de ses présentations officielles, NVIDIA a insisté sur le fait que jusqu’à 1 pétaflops de puissance étaient réalisables avec cette configuration. Cela n’empêche pas la plateforme de s’adapter à des calculs plus exigeants, offrant ainsi un large éventail de cas d’utilisation.
Si NVIDIA maîtrise déjà le domaine des GPU et du calcul accéléré, MediaTek apporte ici son savoir-faire dans la conception de puces ARM à consommation électrique réduite. On parle de 20 cœurs ARM pour la partie CPU, le tout connecté à la puce graphique via une interface très haut débit. Résultat : une latence de communication considérablement réduite et une consommation maîtrisée sur un seul SoC (Système sur puce). Cette approche unifiée favorise la cohérence de la mémoire et évite de devoir multiplier les modules de stockage, puisque chaque poste de travail peut embarquer jusqu’à 128 Go de mémoire et plusieurs téraoctets de stockage NVMe.