Dans l’offre de cartes graphiques professionnelles Nvidia de nouveaux modèles sur l’architecture sont apparus Il y a Lovelace. Ceci, par exemple, apporte jusqu’à 2 fois plus de débit dans les calculs FP32, de même jusqu’à 2 fois plus de performances des cœurs RT et Tensor. Ici, nous avons DLSS 3, qui trouvera une utilisation non seulement dans les jeux, mais aussi dans les applications professionnelles pour l’accélération de l’imagerie grâce à l’IA. Il existe également une plus grande mémoire qui utilise ECC (contrôle d’erreurs), et les cartes sont également optimisées pour différents types de réalité augmentée (AR, VR et MR).
L’offre commence à deux RTX 4000, existant dans une version SFF plus petite et une nouvelle dans la version classique. Les horloges de la puce et de la mémoire diffèrent, ce qui affecte les performances, mais aussi la consommation. La version SFF se débrouille avec seulement 70 W, alors qu’en FP32 elle offre une performance élevée de 19,2 TFLOPS. Il s’agit d’une performance quelque part entre la GeForce RTX 4060 (15,1 TFLOPS) et la RTX 4060 Ti (22,1 TFLOPS), mais elles consomment respectivement 115 W. 160 W. Le bus mémoire 160 bits peut être utilisé ici, et nous avons la capacité de mémoire inhabituelle de 20 Go. La version à part entière avec des fréquences plus élevées est légèrement en dessous de la GeForce RTX 4070 avec une performance de 26,7 TFLOPS, mais elle ne gère que 130 W contre 200 W. Par rapport à la RTX A2000 professionnelle, le nouveau produit a 2,1 fois les performances graphiques, 70 % plus élevé en CAO, 2 fois pour le rendu, de 80 % dans les tâches d’IA et 2,1 fois plus élevé en HPC.
RTX 4000 SFF | RTX 4000 | RTX 4500 | RTX 5000 | RTX 6000 | |
Cœurs CUDA | 6144 | 6144 | 7680 | 12800 | 18176 |
Le tenseur du noyau | 192 | 192 | 240 | 400 | 568 |
Cœurs RT | 48 | 48 | 60 | 100 | 142 |
Fréquence | environ 1,56 GHz | environ 2,17 GHz | environ 2,58 GHz | environ 2,55 GHz | environ 2,51 GHz |
Performances en FP32 | 19,2 TFLOPS | 26,7 TFLOPS | 39,6 TFLOPS | 65,3 TFLOPS | 91,1 TFLOPS |
Performances en TR | 44,3 TFLOPS | 61,8 TFLOPS | 91,6 TFLOPS | 151 TFLOPS | 210,6 TFLOPS |
Tenseur de performances | 306,8 TFLOPS | 327,6 TFLOPS | 634 TFLOPS | 1044,4 TFLOPS | 1457 TFLOPS |
Interface | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Mémoires | 20 Go de mémoire GDDR6 | 20 Go de mémoire GDDR6 | 24 Go de mémoire GDDR6 | 32 Go de mémoire GDDR6 | 48 Go GDDR6 |
Bus mémoire | 160 bits | 160 bits | 192 bits | 256 bits | 384 bits |
Vitesse de la mémoire | 14 Gbit/s | 18 Gbit/s | 18 Gbit/s | 18 Gbit/s | 20 Gbit/s |
Débit mémoire | 280 Go/s | 360 Go/s | 432 Go/s | 576 Go/s | 960 Go/s |
Consommation | 70W | 130W | 210W | 250W | 300W |
Dimensions | 69×168 millimètres | 112×241 millimètres | 112×267 millimètres | 112×267 millimètres | 112×267 millimètres |
Ports | 4× miniDP 1.4a | 4× DP 1.4a | 4× DP 1.4a | 4× DP 1.4a | 4× DP 1.4a |
RTX 4500 atteint 7680 cœurs CUDA, ce qui est le même que le GeForce RTX 4070 Ti, et en raison des horloges similaires, il a également des performances similaires, cependant, la consommation n’est que de 210 W au lieu de 285 W. Son interface 192 bits fonctionne avec 24 Go de mémoire, mais ils ont des horloges inférieures . Nvidia affirme qu’il offrira 40% de performances en plus que le RTX A4500 pour l’IA générative, 60% de plus en graphisme, 50% de plus en rendu, et il en va de même pour l’évaluation des algorithmes d’IA et de CAO. Dans Omniverse, les performances sont censées être 2,7 fois supérieures.
2023-08-09 20:29:40
1691626914
#Nvidia #pour #station #travail #RTX #avec #jusquà #performances #pour #lIA