NVIDIA et Google Cloud collaborent pour faire progresser l'IA agentique et l'IA physique

NVIDIA et Google Cloud collaborent depuis plus de dix ans pour concevoir ensemble une plateforme d’IA complète couvrant chaque couche technologique, des bibliothèques et des frameworks optimisés pour les performances aux services Cloud pour entreprise.

Cette fondation permet aux développeurs, aux startups et aux entreprises de sortir l’IA agentique et l’IA physique des laboratoires pour la mettre en production — des agents qui gèrent des workflows complexes aux robots et aux jumeaux numériques en usine.

Lors de l’événement Google Cloud Next, qui a lieu cette semaine à Las Vegas, le partenariat franchit une nouvelle étape avec des avancées visant à étendre l’hyperordinateur d’IA Google Cloud pour les usines d’IA qui alimenteront la nouvelle frontière de l’IA agentique et de l’IA physique.

Ces dernières incluent les nouvelles solutions A5X bare-metal basées sur NVIDIA Vera Rubin ; un aperçu de Google Gemini sur Google Distributed Cloud basé sur NVIDIA Blackwell et les GPU NVIDIA Blackwell Ultra ; VM confidentielles avec des GPU NVIDIA Blackwell ; et l’IA agentique sur la plateforme d’agents Gemini Enterprise avec les modèles ouverts NVIDIA Nemotron et le framework NVIDIA NeMo.

Infrastructure de nouvelle génération : de NVIDIA Blackwell à Vera Rubin

Lors de l’événement Google Cloud Next, Google a annoncé le lancement de l’A5X avec des systèmes à l’échelle de rack NVIDIA Vera Rubin NVL72, qui, grâce à une codesign extrême de puces, de systèmes et de logiciels, offrent un coût d’inférence par jeton jusqu’à 10 fois plus faible et un débit de jetons par mégawatt 10 fois plus élevé que la génération précédente.

A5X utilisera des NVIDIA ConnectX-9 SuperNIC, combinés à la mise en réseau de nouvelle génération Google Virgo, pour permettre une mise à l’échelle jusqu’à 80 000 GPU NVIDIA Rubin au sein d’un seul cluster de site et jusqu’à 960 000 GPU NVIDIA Rubin dans un cluster multisite, permettant aux clients d’exécuter leurs charges de travail d’IA les plus importantes sur une infrastructure optimisée pour NVIDIA.

« Chez Google Cloud, nous pensons que la prochaine décennie de l’IA sera façonnée par la capacité de nos clients à exécuter leurs charges de travail les plus exigeantes sur une pile d’infrastructure véritablement intégrée et optimisée pour l’IA », a déclaré Mark Lohmeyer, vice-président et directeur général de l’IA et de l’infrastructure de calcul chez Google Cloud. « En combinant l’infrastructure évolutive et les services d’IA gérés de Google Cloud avec les plateformes, les systèmes et les logiciels de pointe de NVIDIA, nous offrons à nos clients la flexibilité nécessaire pour tout entraîner, affiner et exploiter, des modèles de pointe et ouverts aux charges de travail d’IA agentique et d’IA physique — tout en optimisant les performances, le coût et la durabilité. »

Le portefeuille NVIDIA Blackwell de Google Cloud comprend des machines virtuelles A4 avec les systèmes NVIDIA HGX B200 et les machines virtuelles A4X à l’échelle du rack avec les systèmes NVIDIA GB200 NVL72 et A4X Max NVIDIA GB300 NVL72, en passant par les machines virtuelles G4 fractionnées avec les GPU NVIDIA RTX PRO 6000 Blackwell Server Edition.

Les clients peuvent adapter leurs capacités d’accélération, qu’ils utilisent plusieurs racks NVL72 interconnectés pouvant atteindre des dizaines de milliers de GPU NVIDIA Blackwell, un rack unique pouvant accueillir jusqu’à 72 GPU Blackwell avec NVIDIA NVLink de cinquième génération et le commutateur NVLink 5, ou seulement un huitième de GPU.

Cette plateforme complète aide les équipes à optimiser chaque charge de travail, du raisonnement MoE, de l’inférence multimodale et du traitement des données aux simulations complexes pour la nouvelle frontière de l’IA physique et de la robotique.

Les principaux laboratoires d’IA de pointe mettent déjà cette infrastructure à l’œuvre. Thinking Machines Lab fait évoluer son interface de programmation d’applications (API) Tinker sur les machines virtuelles A4X Max avec les systèmes GB300 NVL72 pour accélérer l’entraînement, tandis qu’OpenAI exécute une inférence à grande échelle sur les systèmes NVIDIA GB300 (machines virtuelles A4X Max) et GB200 NVL72 (machines virtuelles A4X) sur Google Cloud pour exécuter certaines de ses charges de travail d’inférence les plus exigeantes, y compris pour ChatGPT.

IA sécurisée partout où elle doit s’exécuter : souveraine et confidentielle

Les modèles Google Gemini s’exécutant sur les GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en prévisualisation sur Google Distributed Cloud, afin de permettre aux clients d’intégrer les modèles de pointe de Google là où résident leurs données les plus sensibles.

NVIDIA Confidential Computing avec la plateforme NVIDIA Blackwell permet d’exécuter les modèles Gemini dans un environnement protégé où les invites et les données de réglage fin restent chiffrées et ne peuvent être vues ou modifiées par des parties non autorisées, y compris les opérateurs d’infrastructure.

Dans le Cloud public, la preview des machines virtuelles G4 confidentielles avec des GPU NVIDIA RTX PRO 6000 Blackwell intègre ces protections aux environnements multi-locataires, afin de contribuer à protéger les invites, les modèles d’IA et les données afin que les clients des industries réglementées puissent accéder à la puissance de l’IA sans compromettre la sécurité ou les performances.

Cette solution de calcul confidentiel met pour la première fois à profit les GPU NVIDIA Blackwell dans le Cloud et propose aux clients de Google Cloud une nouvelle base pour une IA sécurisée et haute performance.

Modèles ouverts et API pour l’IA agentique

La plateforme NVIDIA sur Google Cloud est optimisée pour exécuter tout type de modèle, des gammes de pointe Gemini et Gemma de Google aux modèles ouverts NVIDIA Nemotron et à l’écosystème plus large de poids ouverts, permettant aux développeurs de créer des systèmes d’IA agentique qui raisonnent, planifient et agissent.

NVIDIA Nemotron 3 Super est disponible sur Gemini Enterprise Agent Platform, et offre aux développeurs un parcours direct vers la découverte, la personnalisation et le déploiement de modèles de raisonnement optimisés par NVIDIA et de modèles multimodaux pour les workflows agentiques.

Google Cloud et NVIDIA facilitent également l’entraînement et la personnalisation de modèles ouverts à grande échelle. Les clusters d’entraînement gérés sur Gemini Enterprise Agent Platform ont introduit une nouvelle API d’apprentissage par renforcement (RL) gérée basée sur NVIDIA NeMo RL pour accélérer l’entraînement RL à grande échelle tout en automatisant le dimensionnement des clusters, la récupération en cas de panne et l’exécution des tâches, afin que les équipes puissent se concentrer sur le comportement des agents et la qualité des modèles plutôt que sur la gestion de l’infrastructure.

Leader en cybersécurité, CrowdStrike utilise les bibliothèques ouvertes de NVIDIA NeMo comme NeMo Data Designer, NeMo Automodel et NeMo Megatron Bridge pour générer des données synthétiques et le réglage fin de Nemotron et d’autres grands modèles de langage pour la cybersécurité spécifique à un domaine. Grâce à l’exécution de clusters d’entraînement gérés sur la Gemini Enterprise Agent Platform avec les GPU NVIDIA Blackwell, ces capacités accélèrent la détection des menaces, leur analyse et leur solution.

Bâtir l’avenir de l’IA industrielle et physique

La création d’une IA industrielle et physique à grande échelle nécessite un matériel puissant et une combinaison de modèles ouverts, de bibliothèques et de frameworks pour développer ces workflows complexes de bout en bout.

L’infrastructure d’IA de NVIDIA, les modèles ouverts et les bibliothèques d’IA physique disponibles sur Google Cloud, intègrent des applications d’IA industrielle et physique pour permettre aux clients de simuler, d’optimiser et d’automatiser des workflows réels.

Les solutions des principaux fournisseurs de logiciels industriels, dont Cadence et Siemens Digital Industries Software, sont désormais disponibles sur Google Cloud et ont été accélérées sur l’infrastructure d’IA de NVIDIA. Ces applications alimentent la conception, l’ingénierie et la fabrication de créations nouvelles générations, des puces aux véhicules autonomes, en passant par la robotique, les plateformes aérospatiales, les machines lourdes et les systèmes de production à grande échelle.

Grâce aux bibliothèques NVIDIA Omniverse et au framework de simulation robotique open source NVIDIA Isaac Sim disponibles sur Google Cloud Marketplace, les développeurs peuvent créer des jumeaux numériques physiquement précis et développer des pipelines de simulation robotique personnalisés pour entraîner, simuler et valider des robots avant leur déploiement en conditions réelles.

Les microservices NVIDIA NIM pour des modèles tels que NVIDIA Cosmos Reason 2 peuvent être déployés sur Google Vertex AI et Google Kubernetes Engine. Cela permet aux robots et aux agents d’IA de vision de voir, de raisonner et d’agir dans le monde physique comme des humains, alimentant des cas d’utilisation tels que la conservation et l’annotation automatisées des données, la planification et le raisonnement avancés des robots, ainsi que les agents d’analyse vidéo intelligents pour obtenir des informations et une prise de décision en temps réel.

Ensemble, ces technologies aident les développeurs à passer en toute simplicité de la conception assistée par ordinateur à des jumeaux numériques industriels et à des robots pilotés par l’IA, en accélérant les processus, de la validation de la conception à l’optimisation des usines sur la plateforme NVIDIA exécutée sur Google Cloud.

Impact éprouvé : des startups aux entreprises mondiales

Les entreprises internationales, les laboratoires d’IA et les startups à forte croissance utilisent NVIDIA et la plateforme co-conçue de Google Cloud pour passer plus rapidement du prototypage à la production, avec notamment Snap, Schrödinger et Salesforce. Snap réduit le coût des tests A/B à grande échelle en faisant passer ses pipelines de données vers une solution Spark accélérée par GPU sur Google Cloud. Schrödinger réduit les simulations de découverte de médicaments de plusieurs semaines à quelques heures seulement grâce au calcul accéléré de NVIDIA sur Google Cloud.

Les startups orchestrent la nouvelle vague d’innovation en matière d’IA — en créant de nouveaux agents et des applications d’IA native à l’aide du calcul accéléré de NVIDIA sur Google Cloud.

Dans le cadre d’un écosystème plus vaste mis en avant par NVIDIA Inception et Google for Startups, CodeRabbit et Factory utilisent des modèles basés sur NVIDIA Nemotron sur Google Cloud pour alimenter des agents de revue de code et de développement logiciel autonome, tandis que Aible, Mantis AI, Photoroom et Baseten développent des solutions d’entreprise en matière de données, d’intelligence vidéo, d’imagerie générative et d’inférence managée sur la plateforme full-stack NVIDIA sur Google Cloud.

En un peu plus d’un an, plus de 90 000 développeurs ont rejoint la communauté de développeurs conjointe NVIDIA et Google Cloud, en exploitant cette plateforme pour créer et faire évoluer de nouvelles applications d’IA.

Lors de la conférence Google Cloud Next, NVIDIA a par ailleurs été nommé partenaire Google Cloud de l’année dans deux catégories — Partenaire technologique mondial pour l’IA et Calcul pour la modernisation des infrastructures — en reconnaissance de son expertise technique approfondie et de son alignement sur la stratégie de mise sur le marché.

Ensemble, NVIDIA et Google Cloud fournissent aux clients une plateforme à l’échelle du Cloud pour transformer les agents expérimentaux et les simulations en systèmes de production capables d’examiner du code, de sécuriser les flottes, d’activer de nouvelles applications d’IA et d’optimiser les usines dans le monde réel.

Pour en savoir plus sur la collaboration entre les deux entreprises, participez à des sessions NVIDIA, à des démonstrations et à des ateliers lors de la conférence Google Cloud Next.