Nvidia a fait sensation avec l’annonce officielle de ses prochains GPU Blackwell GeForce RTX série 50 lors du keynote du CES 2025. Et même si le halo RTX 5090 ressemble certainement à un monstre absolu, pour beaucoup de gens, c’est le RTX 5070 grand public (-ish) à 549 $ qui sera la star du spectacle. La RTX 4070 est l’une des meilleures cartes graphiques depuis son lancement, et son remplacement est désormais en route.
Nvidia affirme que le 5070 offrira les niveaux de performances « RTX 4090 », à environ un tiers du prix et un peu plus de la moitié de la puissance. Mais comment se comparent-ils réellement et comment le 5070 se compare-t-il au RTX 4070 existant ? Découvrons-le, et nous avons rempli quelques éléments avec les meilleures estimations pour l’instant, mais la plupart des spécifications sont correctes.
Carte graphique | RTX5070 | RTX4090 | RTX4070 |
---|---|---|---|
Architecture | GB205 | AD102 | AD104 |
Nœud de processus | TSMC4NP | TSMC4N | TSMC4N |
Transistors (milliards) | ? | 76,3 | 32 |
Taille de la matrice (mm^2) | ? | 608.4 | 294,5 |
SM | 48 | 128 | 46 |
Shaders GPU | 6144 | 16384 | 5888 |
Noyaux tenseurs | 192 | 512 | 184 |
Cœurs RT | 48 | 128 | 46 |
Horloge boostée (MHz) | 2512 | 2520 | 2475 |
Vitesse VRAM (Gbit/s) | 30 ? | 21 | 21 |
VRAM (Go) | 12 | 24 | 12 |
Largeur du bus VRAM | 192 | 384 | 192 |
Cache L2 | 48 ? | 72 | 36 |
Unités de sortie de rendu | 64 ? | 176 | 64 |
Unités de mappage de texture | 192 | 512 | 184 |
TFLOPS FP32 (Boost) | 30,9 | 82,6 | 29.1 |
TFLOPS FP16 (INT8 HAUTS) | 494 (988) | 661 (1321) | 233 (466) |
Bande passante (Go/s) | 720 ? | 1008 | 504 |
TBP (watts) | 250 | 450 | 200 |
Date de lancement | Février 2025 ? | octobre 2022 | avril 2023 |
Prix de lancement | 549 $ | 1 599 $ | 599 $ |
Tout d’abord, soyons parfaitement clairs : l’idée selon laquelle le RTX 5070 correspondra au RTX 4090 dans toutes les charges de travail ressemble à des lunettes très teintées de rose. Il est évident que Nvidia mise beaucoup sur l’IA avec Blackwell, et compte sur DLSS 4 et d’autres techniques de rendu neuronal pour combler la différence. Mais les spécifications brutes sont toujours importantes dans de nombreux jeux existants, à l’exception d’une solution côté pilote qui permet des performances plus élevées sans nécessiter de correctifs ni de mises à jour.
Le RTX 5070 aura 48 SM par rapport aux 46 SM du 4070. Ce n’est pas un très gros changement du tout, et c’est loin des 128 SM du 4090. Le calcul graphique global du FP32 équivaut à 31 TFLOPS pour le 5070, 29 TFLOPS sur le 4070 et 83 TFLOPS pour le 4090. Il est extrêmement difficile de croire que, en général, le 5070 se rapprochera du 4090 en termes de performances sans tirer parti du DLSS 4 et des technologies associées.
Il y a aussi la VRAM à considérer. Le 4090 dispose de 24 Go, contre la moitié de cette quantité sur les 4070 et 5070. Il n’y a pas beaucoup de jeux où 12 Go sont insuffisants, mais Indiana Jones and the Great Circle, avec RT complet et sans upscaling, dépasse nettement les 12 Go en 4K. D’autres jeux pourraient bientôt arriver et pourraient dépasser les 12 Go d’utilisation de VRAM avec des résolutions et des paramètres plus élevés.
Mais c’est là que le « RTX Neural Material » pourrait entrer en jeu. Cela semble être l’activation de la compression de texture neuronale, quelque chose dont Nvidia a discuté en 2023, entièrement implémentée dans un jeu. Est-ce que ça fonctionnera avec n’importe lequel jeu? Probablement pas, mais nous serions ravis de voir une solution côté conducteur qui fasse d’une telle fonctionnalité une réalité. Sans matériaux neuronaux NTC ou RTX, les 12 Go empêcheront certainement le 5070 de correspondre à un 4090.
Il y a aussi la bande passante à prendre en compte. Le RTX 4090 dispose de 21 Gbps GDDR6X sur une interface 384 bits, contre 28 à 32 Gbps GDDR7 du 5070 sur une interface 192 bits. Nous savons que le 4090 dispose de 1 008 Go/s de bande passante. Le 5070 devrait avoir une bande passante comprise entre 672 Go/s et 768 Go/s. Encore une fois, sans NTC ou matériaux neuronaux, il ne tiendra pas à des résolutions plus élevées.
Les charges de travail d’IA comme les LLM aiment également avoir une grande capacité VRAM. La quantification ne vous mène pas loin, et la compression neuronale des LLM n’est pas une chose (à notre connaissance). Le RTX 4090 avec 24 Go de VRAM peut simplement charger des LLM plus grands que le 5070, qui ne correspondra qu’au 4070 en termes de tailles de modèles AI.
C’est une autre histoire lorsque nous examinons les performances informatiques de l’IA. Nous savons que la série RTX 50 prendra en charge le format numérique FP4, mais tout aussi important, elle semble avoir deux fois plus de calcul par cœur tensoriel que la série RTX 40. Ce n’est pas assez de calcul pour que le 5070 surpasse le 4090, mais ses performances théoriques sont « seulement » environ 25 % plus lentes. Et si quelque chose peut exploiter FP4 sur le 5070 là où le 4090 doit utiliser FP8, alors il pourrait mieux fonctionner sur le 5070. Mais même l’INT8 TOPS favorise le 4090.
Le vrai plus, c’est bien sûr le prix. De nombreux joueurs ne peuvent tout simplement pas se permettre une carte graphique à 1 599 $ – sans parler des prix de plus de 2 000 $ induits par la rareté que nous voyons actuellement sur le 4090. Un GPU à 549 $, même s’il est plus lent dans la plupart des jeux, est une tout autre affaire. . Les GPU de classe xx70 de Nvidia sont traditionnellement l’endroit idéal pour les joueurs grand public, et le 5070 semble continuer sur cette lancée. Même s’il ne bat pas le 4090, s’il parvient systématiquement à délivrer des performances proches du niveau du RTX 4080, il devrait finir par être extrêmement performant.
DLSS4 | Nouvelle génération multi-images et tout amélioré – YouTube
Regarder dessus
Mais en réalité, tout se résume aux fonctionnalités d’IA et au DLSS 4. Nous n’avons pas encore essayé la génération multi-images, et après nos expériences avec la génération d’images DLSS 3, nous sommes au mieux sceptiques. Il semble que cela générera jusqu’à trois images entre deux images rendues, ce qui semble ne ferait qu’augmenter la latence. Mais DLSS 4 semble également générer ces images plus rapidement, ce qui signifie que le résultat net ne serait pas pire que la génération d’images DLSS 3, juste avec des images supplémentaires.
À notre avis, les améliorations et les mises à niveau apportées à la mise à l’échelle DLSS et à la reconstruction de rayons sont bien plus prometteuses que la génération multi-images. Jusqu’à présent, le DLSS utilisait un CNN (Convolutional Neural Network) pour la formation et l’inférence de l’IA. Il existe désormais un nouveau modèle basé sur un transformateur, qui peut apparemment être utilisé sur tous les jeux DLSS 2/3 existants.
Les modèles de transformateurs ont révolutionné de nombreux domaines du développement de l’IA, et les exemples de séquences de la vidéo ci-dessus montrant CNN vs transformateur DLSS semblent extrêmement prometteurs. Nvidia revendique depuis un certain temps déjà un rendu « meilleur que natif » du DLSS, mais le modèle de transformateur DLSS pourrait enfin répondre à ces affirmations. Si c’est le cas, cela pourrait être la fonctionnalité phare qui fait que la série 50 vaut le prix d’entrée. Sauf que le modèle de transformateur fonctionne également sur les GPU existants, donc peut-être pas.
Comme nous l’avons noté par le passé, alors que les GPU RTX promettaient le traçage de rayons en tant que nouvelle technologie, au fil du temps, ce sont vraiment les fonctionnalités d’IA qui sont devenues l’aspect le plus important de la série RTX. Avec la série RTX 50, Nvidia double encore une fois l’IA et le logiciel DLSS pris en charge continue de dépasser l’aspect RT. Que la génération multi-images s’avère ou non être une fonctionnalité qui tue, si vous ne possédez pas déjà un GPU de la série 40, la série 50, y compris le RTX 5070, pourrait vous inciter à effectuer une mise à niveau.