GeForce RTX 4000 : prix, date, performances… tout savoir sur les cartes graphiques de Nvidia

 
Architecture Ada Lovelace, GeForce RTX 4000, DLSS 3, voici tout ce qu’il faut savoir sur les nouveautés de Nvidia dévoilées en 2022.

Nvidia a dévoilé ses cartes graphiques GeForce RTX 4000 le 20 septembre 2022 lors de sa conférence GTC Beyond GeForce. Ces nouvelles cartes utilisent l’architecture Ada Lovelace.

Les cartes graphiques

Nvidia GeForce RTX 4090

La GeForce RTX 4090 est la plus puissante des cartes graphiques Ada Lovelace de Nvidia.

Voici ses caractéristiques.

  • AD102
  • 16384 CUDA Cores
  • 512 Tensore Core (4e génération)
  • 128 RT Cores (3e génération)
  • Fréquence boost : 2520 MHz
  • VRAM : 24 Go GDDR6X – 384 bit – 21 Gb/s
  • Bande passante mémoire : 1000 Go/s
  • Double moteur NVENC (encodage 2x plus rapide sur les applications compatibles)
  • TSMC 4N
  • TGP : 450W
  • Taille de la puce : 608,5 mm²

La GeForce RTX 4090 sera lancée le 12 octobre 2022 à partir de 1949 euros.

Nvidia GeForce RTX 4080 (16 GB)

Pour succéder à la GeForce RTX 3080 basée sur la puce GA102, Nvidia propose une GeForce RTX 4080 en version 16 Go équipée d’une puce AD103.

  • AD103
  • 9728 CUDA Cores
  • 304 Tensore Core (4e génération)
  • 76 RT Cores (3e génération)
  • Fréquence boost : 2505 MHz
  • VRAM : 16 Go GDDR6X – 256 bit – 22,4 Gb/s
  • Bande passante mémoire : 716,8 Go/s
  • Double moteur NVENC (encodage 2x plus rapide sur les applications compatibles)
  • TSMC 4N
  • TGP : 320W
  • Taille de la puce : 378,6 mm²

La GeForce RTX 4080 (16GB) sera lancée en novembre 2022 à partir de 1469 euros.

Nvidia GeForce RTX 4080 (12 GB)

Si la puce GA104 avait donné lieu à la GeForce RTX 3070, pour la puce AD104, Nvidia a décidé de nommer sa carte graphique GeForce RTX 4080 (12GB).

Un nom qui peut prêter à confusion puisque les GeForce RTX 4080 16 GB et GeForce RTX 4080 12 GB présente des caractéristiques très différentes, et pas seulement des changements pour la mémoire.

  • AD104
  • 7680 CUDA Cores
  • 240 Tensore Core (4e génération)
  • 60 RT Cores (3e génération)
  • Fréquence boost : 2610 MHz
  • VRAM : 12 Go GDDR6X – 192 bit – 21 Gb/s
  • Bande passante mémoire : 504 Go/s
  • Double moteur NVENC (encodage 2x plus rapide sur les applications compatibles)
  • TSMC 4N
  • TGP : 285W
  • Taille de la puce : 294,5 mm²

La GeForce RTX 4080 (12GB) sera lancée en novembre 2022 à partir de 1099 euros.

L’Architecture Ada Lovelace

Ada Lovelace est le nom de la nouvelle architecture de Nvidia qui succède à Ampere lancé en 2022 pour les cartes grand public. Dans le domaine du calcul haute performance, Nvidia propose aussi l’architecture Hoper, cousine d’Ada. Le géant reprend donc sa stratégie de double architecture Volta et Turing qu’il avait adopté en 2018 pour ses premières cartes capables de proposer du ray tracing.

Nvidia fait reposer Ada Lovelace sur plusieurs piliers pour promettre plus de puissance de calcul à consommation égale.

  • Procédé de fabrication TSMC 4N
  • Nouvelle architecture pour les RT Core
  • Shader Execution Reordering
  • Un nouveau Optical Flow Accelerator pour DLSS 3
  • Nouveau moteur NVENC pour l’encodage vidéo en AV1

TSMC 4N : plus de transistors

La première des nouveautés, c’est le passage au procédé de fabrication TSMC 4N. Il remplace le procédé Samsung 8 nm utilisé sur les cartes Ampere GeForce RTX 3000. Cela permet à Nvidia à la fois d’augmenter la fréquence de fonctionnement de sa puce, mais aussi d’augmenter encore le nombre de transistors et donc d’unités de calcul.

Dans une puce Ada Lovelace AD102 complète, Nvidia annonce l’intégration de 76,3 milliards de transistors soit 18 432 CUDA Cores (70% de plus que Ampere GA102) avec une fréquence supérieure à 2,5 GHz dans un TGP de 450W.

Schéma de la puce AD102 basée sur Ada Lovelace // Source : Nvidia

À titre de comparaison, une puce Apple M1 Max compte 57 milliards de transistors et il s’agit d’un SoC complet intègrant un CPU, un GPU et d’autres éléments. Côté concurence, la meilleure puce RDNA 2 d’AMD s’arrête à 26,8 milliards de transistors.

Nouveaux RT Cores

Nvidia ne s’est pas contenté d’augmenter de façon linéaire le nombre d’unités de calcul pour augmenter les performances de ses cartes graphiques. Le fabricant met aussi en avant une nouvelle architecture pour ses RT Cores, en charge des calculs liés au ray tracing.

La 3e génération de RT Core promet de tester deux fois plus vite les intersections entre les triangles et les rayons de lumière.

Nvidia y ajoute un Opacity Micromap Engine, qui doit accélérer les effets de ray tracing sur des modèles utilisant des textures avec de la transparence. En quelques mots, cela doit permettre de déterminer plus rapidement quelles sont les parties du modèle avec de l’opacité et lesquelles ont de la transparence.

L’opacity micromap sur la figure b // Source : Nvidia

Enfin, il y a le Displaced Micro-Mesh Engine qui permet de mieux gérer l’augmentation de la complexité de la géométrie des objets en 3D.

Tout cela doit à la fois permettre d’obtenir un rendu plus précis et plus rapide. Sur les générations précédentes, le ray tracing trouvait notamment sa limite dans certains environnements ou sur certains modèles, notamment les feuillages très denses.

Shader Execution Reordering

Semblable dans sa philosophie au Out of Order Execution (Exécution dans le désordre) des processeurs, le Shader Execution Reordering est une nouvelle technique de calcul.

Il s’agit de réorganiser dynamiquement l’ordre de calcul des shaders pour optimiser le travail en ray tracing. D’après Nvidia, cette fonction permet à elle seule d’améliorer les performances jusqu’à 44 % dans Cyberpunk 2077 avec le ray tracing Overdrive activé.

Support du AV1

La dernière nouveauté d’Ada Lovelace concerne plutôt les créateurs de contenu. L’architecture intègre désormais la 8e génération de moteur hardware d’encodage NVENC. Il ajoute notamment l’encodage du codec AV1 qui permet une meilleure qualité d’image à débit égal. L’encodage AV1 est 40% plus efficace que le H.264.

DLSS 3

Le DLSS 2.0 s’est imposé comme l’une des meilleures technologies développées par Nvidia au cours des dernières années. Lorsqu’il est proposé dans un jeu, le DLSS permet d’augmenter la définition d’une image par IA. Plus concrètement, cela permet de baisser la définition de rendu d’un jeu pour augmenter les performances (un jeu en 720p est plus simple à calculer qu’un jeu en 4K), pour ensuite augmenter la définition par l’IA et gagner sur les deux tableaux : qualité d’image et performance.

Le DLSS 3 va encore plus loin en y ajoutant un système de Frame Generation, qui va donc calculer artificiellement des images supplémentaires et augmenter encore les performance du jeu. D’après Nvidia, cela doit permettre de doubler le nombre d’images par seconde en comparaison du DLSS 2.

Cette version du DLSS est exclusive à Ada Lovelace et demande un nouveau moteur Optical Flow Accelerator trouvé sur les GeForce RTX 4000.

Comme l’ajout d’images complètes peut générer de la latence supplémentaire, les jeux qui proposent DLSS 3 intègrent également Nvidia Reflex. Elle doit permettre de compenser la latence. Cela signifie tout de même que le DLSS 3 ne devrait pas s’adresser aux jeux compétitifs en premier lieu.

En revanche, les jeux limités par le processeur devraient bénéficier grandement de DLSS 3 qui permet à la carte graphique de rajouter des images par seconde en totale autonomie. Nvidia ainsi fait la démonstration sur le jeu Microsoft Flight Simulator, connu pour être très limité par le CPU.

En combinant le DLSS 3 avec les autres nouveautés de l’architecture Ada sur des jeux avec du ray tracing, Nvidia promet une multiplication jusqu’à 4x des performances.


Les derniers articles