Inférence d’IA agentique à un dixième du coût par jeton avec NVIDIA Vera Rubin NVL72. Les sandboxes d’agents s’exécutent à 50 % plus rapidement sur NVIDIA Vera que les CPU traditionnels, tandis que les requêtes de données d’entreprise sont jusqu’à 3 fois plus rapides avec le CPU Vera. Par ailleurs, 5 000 entreprises comme Lilly, Samsung et Honeywell exécutent des charges de travail d’IA sur Dell AI Factories avec NVIDIA, ce qui leur permet de transformer leurs ambitions en production à grande échelle.
C’est le tableau qu’a dépeint Michael Dell lundi matin lors de Dell Technologies World. Dell a évalué l’ampleur des enjeux : les dépenses mondiales en infrastructure d’IA pourraient atteindre 3 à 4 000 milliards de dollars d’ici 2030, tandis que la consommation de jetons devrait croître de 3 400 % au cours de la même période.
« Il y a un boom massif des investissements dans l’IA qui est déjà en cours, et un boom de la productivité commence, et dans certaines entreprises, dont la nôtre », a déclaré Dell. « Le rythme d’évolution est devenu parabolique et ne ralentit pas. »
Le Président et DG de Dell a ensuite accueilli le fondateur et PDG de NVIDIA, Jensen Huang, sur scène — avec un aperçu du portefeuille NVIDIA derrière lui, allant d’un Dell Pro Max de bureau avec station de travail GB10 à un Dell PowerRack avec NVIDIA Vera Rubin NVL72.
« Nous voilà désormais à l’ère de l’IA utile, ce qui explique pourquoi la demande devient parabolique, absolument parabolique », a déclaré Huang. « Ce qui prenait des mois prend désormais des semaines. » Ce qui prenait des semaines prend désormais des jours. Et ce qui prenait des jours, prend désormais des heures. C’est une avancée majeure pour la productivité, mais un bond de géant en termes de besoins de calcul. »
Le message : l’IA d’entreprise a dépassé les essais pilotes pour passer à des déploiements d’IA agentique et d’inférence à grande échelle. La plateforme pour ce qui nous attend est la Dell AI Factory avec NVIDIA — exécutant des modèles de pointe et des agents autonomes de manière sécurisée derrière le périmètre de l’entreprise.
Une nouvelle usine d’IA pour l’ère agentique
L’actualité en matière de calcul accéléré est au cœur de cette mise à jour : le Dell PowerEdge XE9812, basé sur NVIDIA Vera Rubin NVL72, offre un coût par jeton jusqu’à 10 fois inférieur à celui de NVIDIA Blackwell pour l’inférence d’IA agentique à grande échelle.
Il est accompagné des serveurs PowerEdge XE9880L, XE9885L et XE9882L, les premiers systèmes Dell basés sur NVIDIA HGX Rubin NVL8, qui prennent en charge jusqu’à 144 GPU par rack avec des nœuds de calcul 100 % à refroidissement liquide direct et des performances jusqu’à 10 fois supérieures à HGX B200.
En outre, la mise en réseau s’appuie sur la nouvelle gamme Dell PowerSwitch avec NVIDIA Quantum-X800 InfiniBand, qui propose des systèmes optiques co-embarqués et à refroidissement liquide et NVIDIA Spectrum-6 Ethernet.
Dell lance également Dell PowerRack, un système entièrement intégré (calcul, mise en réseau et stockage) doté d’une conception thermique, d’une gestion de l’alimentation et d’une optimisation logicielle conçues pour fonctionner ensemble. Il en résulte une accélération des charges de travail d’IA et de calcul haute performance à l’échelle de l’entreprise, sans les frais généraux d’intégration liés à l’assemblage de composants.
Concernant les CPU, les serveurs Dell PowerEdge M9822 et R9822 intègrent les CPU NVIDIA Vera à l’usine d’IA d’entreprise. Spécialement conçue pour l’IA agentique, Vera exécute des pipelines de données, des analyses, des outils sandbox et des charges de travail de code où chaque étape attend la fin de la précédente.
Avec une bande passante mémoire de 1,2 To/s et des performances prévisibles sous charge, Vera exécute des charges de travail agentiques 50 % plus rapidement que les processeurs x86, ce qui permet aux systèmes PowerEdge d’augmenter le rendement de l’AI Factory grâce à des réponses plus rapides de la part des agents et à des boucles de rétroaction plus courtes.
« Le CPU Vera offre les performances en mono-thread les plus élevées de tous les CPU au monde », a déclaré Huang. « Il dispose de trois fois plus de bande passante mémoire. Par conséquent, Starburst, DuckDB et toutes ces bases de données s’exécutent incroyablement vite, car les agents sollicitent intensément les bases de données. Il est donc préférable que le CPU soit ultrarapide. »
Starburst, un nouveau moteur de données basé sur la Dell AI Data Platform avec NVIDIA, offre un débit de requêtes 3 fois plus rapide sur le CPU NVIDIA Vera pour les analyses SQL à grande échelle.
Les données d’entreprise fournissent le carburant de l’usine d’IA. La mise à jour de la Dell AI Data Platform avec NVIDIA est axée sur des moteurs de données accélérés basés sur les bibliothèques NVIDIA CUDA-X, notamment cuDF pour les données structurées et cuVS pour les données non structurées.
Plusieurs clients de la Dell AI Factory avec NVIDIA ont été présentés lors de la keynote.
Diogo Rau, vice-président exécutif et directeur de l’information et du numérique chez Lilly, est intervenu au début de la conférence, pour discuter des avancées et de l’innovation de Lilly basées sur l’IA dans les sciences de la vie, alimentées par l’infrastructure d’IA déployée à grande échelle avec Dell et NVIDIA.
Il a décrit la technologie comme la clé pour fournir une science de pointe, à grande échelle. « Je pense que nous sommes sur le point d’être peut-être en mesure de mettre fin aux maladies telles que nous les connaissons », a déclaré Rau. « Une telle chose était totalement inimaginable il y a 20 ans, mais nous pouvons aujourd’hui l’envisager. »
Une vidéo de Samsung a suivi, mettant en évidence des cas d’utilisation pour la conception et la fabrication de puces R&D basées sur la Dell AI Factory avec NVIDIA.
Suresh Venkatarayalu, directeur de la technologie chez Honeywell, a rejoint Michael Dell pour témoigner de la transition de l’entreprise du cloud public vers une IA sur site, en utilisant la Dell AI Factory et la plateforme de données d’IA Dell avec NVIDIA pour les cas d’utilisation d’IA industrielle. Jumeaux numériques et automatisation du data center à l’Edge.
« Selon moi, ce partenariat avec Dell et NVIDIA ne se limite pas à l’accès à une infrastructure », explique M. Venkatarayalu. Il s’agit de la stack IA complète, a-t-il expliqué : évolutive, sécurisée et à laquelle les clients font confiance.
Par ailleurs, dans le domaine des services financiers, la société de trading algorithmique Hudson River Trading étend son déploiement Dell pour alimenter la recherche basée sur l’IA. Elle exécute des serveurs Dell PowerEdge XE9685L avec calcul accéléré NVIDIA et Ethernet NVIDIA Spectrum-X pour évoluer avec les données, les modèles et l’ambition de l’entreprise.
Agents et modèles sur site : en toute sécurité
La propre enquête de Dell sur l’adoption de l’IA, citée lors de la conférence d’ouverture, a révélé que 67 % des charges de travail d’IA s’exécutent désormais en dehors du cloud (sur site, sur appareil, à l’Edge ou en colocation) et que 88 % des personnes interrogées exécutent au moins une charge de travail d’IA sur site.
Les annonces concernant l’IA sur site ont répondu à une question directement posée par Dell : « Comment déployer les meilleurs modèles d’IA au monde là où vous en avez besoin, avec une sécurité et une gouvernance intégrées ? »
La réponse repose sur NVIDIA Confidential Computing, fournie conjointement avec Fortanix, Google, Red Hat et d’autres partenaires, permettant de déployer des modèles de pointe en toute sécurité au sein de l’entreprise sans exposer les données ni les IP des modèles.
Cela permet aux entreprises de protéger les modèles d’IA et les données sensibles en cours d’utilisation tout en bénéficiant de l’efficacité des jetons, des performances et des avantages en termes de coûts de l’infrastructure d’IA sur site.
Modèles propriétaires de pointe, protégés par Confidential Computing
Google Distributed Cloud (GDC) avec Gemini 3.0 est désormais disponible en version préliminaire sur les serveurs Dell PowerEdge XE9780, accélérés par NVIDIA Blackwell et sécurisés par NVIDIA Confidential Computing — offrant ainsi aux entreprises un environnement informatique confidentiel privé pour l’IA avancée.
SpaceXAI intégrera également les derniers modèles SpaceXAI sur site à la Dell AI Factory, grâce à NVIDIA Confidential Computing qui permettra de protéger les poids des modèles et les données d’entreprise de bout en bout.
Modèles Open Frontier, exécutés en natif sur la Dell AI Factory
Les modèles NVIDIA Nemotron, à l’intelligence ouverte de pointe, s’exécutent sur l’infrastructure Dell AI Factory pour les entreprises qui souhaitent des modèles à poids ouverts adaptés à leurs propres domaines et données.
Les modèles d’IA open source de Reflection sont également disponibles sur site, spécialement conçus pour les secteurs réglementés, les gouvernements et les entités souveraines.
Des modèles ouverts supplémentaires, MiniMax-M2.7, DeepSeek Pro, DeepSeek-V4, GLM 5.1 et Kimi K2.6 avec optimisation NVIDIA NVFP4, sont disponibles sur le Dell Enterprise Hub sur Hugging Face, rejoignant Gemma 4, NVIDIA Nemotron Super 3, Mistral Small 4 et Arcee Trinity-Large-Thinking.
Dans cette nouvelle ère agentique, les entreprises ont également besoin d’agents pour travailler en toute sécurité dans les environnements hybrides et sur site où leurs données, systèmes et workflows sont déjà hébergés.
OpenAI Codex se connectera à la Dell AI Data Platform pour aider les clients à rapprocher Codex du contexte interne faisant l’utilité des agents : bases de code, documentation, systèmes d’entreprise, connaissances opérationnelles et workflows d’équipe. Dell et OpenAI étudieront également comment Codex peut se connecter à la Dell AI Factory.
Écosystème de partenaires logiciels
Dell a annoncé plusieurs nouveaux partenariats logiciels pour des cas d’utilisation courants d’IA d’entreprise, allant de l’IA agentique aux assistants de code en passant par la vision par ordinateur.
Cela inclut Palantir’s sovereign AI OS reference architecture avec NVIDIA, annoncée en mars, qui fonctionne désormais sur l’infrastructure Dell — pour le déploiement sur site de Palantir Ontology et AIP, intégrée à l’architecture de référence NVIDIA Sovereign AI OS.
En outre, les clients ServiceNow pourront tirer parti de la Dell AI Factory pour réunir l’infrastructure et l’automatisation des workflows d’entreprise, ce qui permettra aux entreprises de découvrir, de gérer et d’opérationnaliser l’IA axée sur les résultats commerciaux.
Dell a également annoncé de nouvelles solutions avec un large éventail de leaders de l’IA et d’innovateurs logiciels, dont Fogsphere, Ipsotek, Mistral AI, Poolside et Uneeq, ainsi que des partenariats de sécurité avec CrowdStrike et Fortanix.
Agents du bureau au centre de données
Nouveautés informatique personnelle : Dell Deskside Agentic AI avec la pile NVIDIA NemoClaw, l’environnement d’exécution NVIDIA OpenShell et les modèles ouverts NVIDIA Nemotron s’exécutant sur Dell Pro Max avec GB10 et GB300 alimentés par l’architecture NVIDIA Grace Blackwell, ainsi que les systèmes Dell Pro Precision alimentés par les stations de travail NVIDIA RTX PRO Blackwell.
Couche de personnalisation : NVIDIA Nemotron, NVIDIA Agent Toolkit et NVIDIA NeMoClaw, l’ensemble d’orchestration d’agents décrit par Huang comme la couche de connectivité entre les modèles locaux et les données d’entreprise, fournissent les bases pour la création d’agents autonomes d’entreprise, permettant aux entreprises de personnaliser leurs modèles, d’orchestrer leurs workflows d’agents et de connecter de manière sécurisée leurs agents aux données et outils d’entreprise.
Couche de sécurité : NVIDIA OpenShell, un runtime open source pour le développement et le déploiement d’agents autonomes avec des contrôles de sécurité et de confidentialité, permet l’application des stratégies d’entreprise au niveau de la couche d’infrastructure et est intégré aux principales plateformes logicielles d’entreprise.
NVIDIA OpenShell est désormais pris en charge dans l’ensemble de la Dell AI Factory avec NVIDIA, offrant aux développeurs un runtime sécurisé pour créer, déployer et gérer des agents d’IA, des stations de travail aux serveurs.
Dell a également mis en avant la prise en charge du NVIDIA AI-Q Blueprint, offrant aux entreprises un exemple de référence pour déployer des workflows multi-agents pour la recherche approfondie — accélérant ainsi le passage du développement au pilote puis à la production.
Jour deux
Lors de la deuxième journée du Dell Technologies World, Jeff Clarke, directeur des opérations de Dell, et Arthur Lewis, président du groupe Infrastructure Solutions, approfondiront les connaissances sur le CPU NVIDIA Vera, Vera Rubin, Confidential Computing et Nemotron, avec une démonstration en direct de l’IA agentique Dell Deskside.
Les thèmes définis lundi par Huang et Dell (agents sûrs et durables, usines full stack, déploiement sur site sécurisé) préparent les annonces plus larges que NVIDIA présentera à la GTC Taipei à COMPUTEX, qui se déroulera du 1er au 4 juin.
