NVIDIA DGX SuperPOD ouvre la voie aux déploiements de systèmes à grande échelle basés sur la plateforme NVIDIA Rubin, une nouvelle avancée en matière de calcul d’IA.
Lors du salon professionnel CES de Las Vegas, NVIDIA a présenté aujourd’hui la plateforme Rubin, qui comprend six nouvelles puces conçues pour fournir un supercalculateur d’IA incroyable et conçues pour accélérer l’IA agentique, les modèles MoE (Mixture-of-Experts) et le raisonnement à long contexte.
La plateforme Rubin regroupe six puces (le CPU NVIDIA Vera, le GPU Rubin, le commutateur NVLink 6, le ConnectX-9 SuperNIC, le DPU BlueField-4 et le commutateur Ethernet Spectrum-6) grâce à une approche de conception conjointe avancée qui accélère l’entraînement et réduit le coût de la génération de jetons d’inférence.
DGX SuperPOD reste la conception fondamentale pour le déploiement de systèmes basés sur Rubin dans des environnements d’entreprise et de recherche.
La plateforme NVIDIA DGX aborde l’ensemble de la pile technologique, du calcul NVIDIA à la mise en réseau en passant par les logiciels, en tant que système unique et cohérent, ce qui élimine le fardeau de l’intégration de l’infrastructure et permet aux équipes de se concentrer sur l’innovation d’IA et les résultats commerciaux.
« Rubin arrive exactement au bon moment, alors que la demande de calcul d’IA pour l’entraînement et l’inférence explose », a déclaré Jensen Huang, fondateur et PDG de NVIDIA.
Nouvelle plateforme pour la révolution industrielle de l’IA
La plateforme Rubin utilisée dans les nouveaux systèmes DGX introduit cinq avancées technologiques majeures conçues pour stimuler une augmentation significative de l’intelligence et de l’efficacité :
- NVIDIA NVLink de sixième génération : 3,6 To/s par GPU et 260 To/s par rack Vera Rubin NVL72 pour les charges de travail MoE massives et les charges de travail à long contexte.
- CPU NVIDIA Vera : 88 cœurs NVIDIA Olympus personnalisés, une compatibilité complète avec Armv9.2 et une connectivité NVLink-C2C ultra-rapide pour un calcul d’usine d’IA efficace à la pointe du secteur.
- GPU NVIDIA Rubin : 50 pétaflops de calcul NVFP4 pour l’inférence d’IA, avec un moteur Transformer de troisième génération avec compression matérielle.
- Informatique confidentielle NVIDIA troisième génération : Vera Rubin NVL72 est la première plateforme à l’échelle du rack à fournir l’informatique confidentielle NVIDIA, qui préserve la sécurité des données dans les domaines CPU, GPU et NVLink.
- Moteur RAS de deuxième génération : grâce au GPU, au CPU et à NVLink, la plateforme NVIDIA Rubin offre une surveillance de l’état en temps réel, une tolérance aux pannes et une maintenance proactive, avec des plateaux modulaires sans câble pour une maintenance trois fois plus rapide.
Ensemble, ces innovations offrent une réduction jusqu’à 10 fois du coût des jetons d’inférence par rapport à la génération précédente, une étape essentielle à mesure que la taille, le contexte et la profondeur de raisonnement des modèles d’IA augmentent.
DGX SuperPOD : le modèle pour NVIDIA Rubin Scale-Out
Les déploiements DGX SuperPOD basés sur Rubin intégreront :
- Systèmes NVIDIA DGX Vera Rubin NVL72 ou DGX Rubin NVL8
- DPU NVIDIA BlueField‑4 pour une infrastructure sécurisée et définie par logiciel
- Plateforme de stockage de mémoire contextuelle d’inférence NVIDIA pour l’inférence nouvelle génération
- NVIDIA ConnectX‑9 SuperNICs
- NVIDIA Quantum‑X800 InfiniBand et NVIDIA Spectrum‑X Ethernet
- NVIDIA Mission Control pour l’orchestration et les opérations automatisées d’infrastructure d’IA
NVIDIA DGX SuperPOD avec DGX Vera Rubin NVL72 unifie huit systèmes DGX Vera Rubin NVL72, avec 576 GPU Rubin, pour offrir 28,8 exaflops de performances FP4 et 600 To de mémoire rapide. Chaque système DGX Vera Rubin NVL72, qui combine 36 CPU Vera, 72 GPU Rubin et 18 DPU BlueField-4, permet un espace de mémoire et de calcul unifiés dans l’ensemble du rack. Avec un débit NVLink agrégé de 260 To/s, il élimine le besoin de partitionnement des modèles et permet à l’ensemble du rack de fonctionner comme un seul moteur d’IA cohérent.
NVIDIA DGX SuperPOD avec des systèmes DGX Rubin NVL8 fournit 64 systèmes DGX Rubin NVL8 avec 512 GPU Rubin. Les systèmes NVIDIA DGX Rubin NVL8 offrent les performances de Rubin dans une Configuration à refroidissement liquide avec des CPU x86 pour offrir aux entreprises une rampe d’accès efficace à l’ère Rubin pour n’importe quel projet d’IA dans le pipeline du développement au déploiement. Propulsé par huit GPU NVIDIA Rubin et NVLink de sixième génération, chaque DGX Rubin NVL8 offre 5,5 fois plus de NVFP4 FLOPS que les systèmes NVIDIA Blackwell.

Mise en réseau nouvelle génération pour les usines d’IA
La plateforme Rubin redéfinit le centre de données en tant qu’usine d’IA haute performance avec une mise en réseau révolutionnaire, notamment des commutateurs Ethernet NVIDIA Spectrum-6, des commutateurs NVIDIA Quantum-X800 InfiniBand, des DPU BlueField-4 et des SuperNICs ConnectX-9, conçus pour gérer les charges de travail d’IA les plus massives au monde. En intégrant ces innovations au NVIDIA DGX SuperPOD, la plateforme Rubin élimine les goulets d’étranglement traditionnels en matière d’échelle, de congestion et de fiabilité.
Connectivité optimisée pour les clusters à grande échelle
La suite de mise en réseau de bout en bout 800 Gbit/s nouvelle génération fournit deux chemins spécialement conçus pour l’infrastructure d’IA, garantissant une efficacité maximale, que ce soit à l’aide d’InfiniBand ou d’Ethernet :
- NVIDIA Quantum-X800 InfiniBand : offre la latence la plus faible du secteur et les performances les plus élevées pour les clusters d’IA dédiés. Il utilise un protocole d’agrégation et de réduction hiérarchique évolutif (SHARP v4) et un routage adaptatif pour transférer des opérations collectives sur le réseau.
- NVIDIA Spectrum-X Ethernet : basée sur le commutateur Ethernet Spectrum-6 et le SuperNIC ConnectX-9, cette plateforme offre une connectivité prévisible, haute performance et évolutive aux usines d’IA à l’aide de protocoles Ethernet standard, optimisés spécifiquement pour les schémas de trafic « est-ouest » des charges de travail d’IA.
Ingénierie de l’usine d’IA gigawatt
Ces innovations représentent une conception conjointe avec la plateforme Rubin. En maîtrisant le contrôle de la congestion et l’isolation des performances, NVIDIA ouvre la voie à la nouvelle vague d’usines d’IA gigawatt. Cette approche holistique garantit que, à mesure que les modèles d’IA gagnent en complexité, la structure de mise en réseau de l’usine d’IA reste un catalyseur pour la vitesse plutôt qu’une contrainte.
Le logiciel NVIDIA fait progresser les opérations et les déploiements d’usine d’IA
NVIDIA Mission Control, un logiciel d’opération et d’orchestration de centres de données d’IA pour les systèmes DGX basés sur NVIDIA Blackwell, sera disponible pour les systèmes NVIDIA DGX basés sur Rubin afin de permettre aux entreprises d’automatiser la gestion et les opérations de leur infrastructure.
NVIDIA Mission Control accélère chaque aspect des opérations d’infrastructure, de la configuration des déploiements à l’intégration aux installations, en passant par la gestion des clusters et des charges de travail.
Grâce à des logiciels intelligents et intégrés, les entreprises contrôlent mieux les événements de refroidissement et d’alimentation pour NVIDIA Rubin, ainsi que la résilience de l’infrastructure. NVIDIA Mission Control permet une réponse plus rapide avec une détection rapide des fuites, débloque l’accès aux dernières innovations de NVIDIA en matière d’efficacité et maximise la productivité des usines d’IA avec une récupération autonome.
Les systèmes NVIDIA DGX prennent également en charge la plateforme logicielle NVIDIA AI Enterprise, notamment les microservices NVIDIA NIM, tels que pour la famille de modèles, de données et de bibliothèques ouverts NVIDIA Nemotron-3.
DGX SuperPOD : la voie vers l’IA industrielle
DGX SuperPOD a longtemps servi de modèle pour l’infrastructure d’IA à grande échelle. L’arrivée de la plateforme Rubin deviendra le LaunchPad d’une nouvelle génération d’usines d’IA, des systèmes conçus pour raisonner au travers de milliers d’étapes et fournir de l’intelligence à un coût considérablement réduit, aidant les entreprises à créer la nouvelle vague de modèles révolutionnaires, de systèmes multimodaux et d’applications d’IA agentique.
NVIDIA DGX SuperPOD avec les systèmes DGX Vera Rubin NVL72 ou DGX Rubin NVL8 seront disponibles au second semestre de l’année.
Voir l’avis sur les informations sur les produits logiciels.
