NVIDIA collabore avec Google Cloud pour apporter l’IA agentique aux entreprises cherchant à exploiter localement la famille de modèles d’IA de Google Gemini à l’aide des plateformes NVIDIA Blackwell HGX et DGX et de NVIDIA Confidential Computing pour la sécurité des données.
Grâce à la plateforme NVIDIA Blackwell sur Google Distributed Cloud, les Data Centers sur site sont en mesure de se conformer aux exigences réglementaires et aux lois sur la souveraineté des données en verrouillant l’accès à des informations sensibles, telles que les dossiers des patients, les transactions financières et les informations gouvernementales classifiées. NVIDIA Confidential Computing protège également le code sensible des modèles Gemini contre les accès non autorisés et les fuites de données.
« En intégrant nos modèles Gemini sur site aux performances révolutionnaires de NVIDIA Blackwell et aux capacités de calcul confidentiel, nous permettons aux entreprises d’utiliser pleinement le potentiel de l’IA agentique », explique Sachin Gupta, vice-président et directeur général de l’infrastructure et des solutions chez Google Cloud. « Cette collaboration permet aux clients d’innover en toute sécurité, sans compromettre les performances ni la facilité d’exploitation. »
Le calcul confidentiel sur NVIDIA Blackwell offre aux entreprises l’assurance technique que les requêtes des utilisateurs transmises à l’interface de programmation d’application des modèles Gemini, ainsi que les données utilisées pour le réglage fin, restent sécurisées et ne peuvent être consultées ou modifiées.
De plus, les propriétaires des modèles peuvent se protéger contre les accès non autorisés ou la falsification, offrant ainsi une protection à double couche qui permet aux entreprises d’innover avec les modèles Gemini tout en préservant la confidentialité des données.
Les agents d’IA à l’origine de nouvelles applications d’entreprise
Cette nouvelle offre arrive au moment où l’IA agentique transforme la technologie d’entreprise en offrant des capacités de résolution de problèmes plus avancées.
Contrairement aux modèles d’IA qui perçoivent ou génèrent des résultats en fonction de connaissances apprises, les systèmes d’IA agentique peuvent raisonner, s’adapter et prendre des décisions dans des environnements dynamiques. Prenons l’exemple de l’assistance informatique d’entreprise : alors qu’un modèle d’IA basé sur la connaissance peut récupérer et présenter des guides de dépannage, un système d’IA agentique peut diagnostiquer les problèmes, effectuer des corrections et escalader les problèmes complexes de manière autonome.
De même, dans le secteur de la finance, un modèle d’IA traditionnel peut repérer des transactions potentiellement frauduleuses en fonction de schémas, mais un système d’IA agentique peut aller encore plus loin en étudiant les anomalies et en prenant des mesures proactives telles que bloquer les transactions avant qu’elles se produisent ou ajuster les règles de détection des fraudes en temps réel.
Le dilemme des infrastructures locales
Bien que de nombreuses infrastructures locales puissent déjà utiliser les modèles dotés d’un raisonnement multimodal, c’est-à-dire, intégrant du texte, des images, du code et d’autres types de données, pour résoudre des problèmes complexes et développer des applications d’IA agentique basées sur le Cloud, celles qui sont soumises à des exigences strictes en matière de sécurité ou de souveraineté des données n’en sont pas encore capables.
Cette annonce fait de Google Cloud l’un des premiers fournisseurs de services Cloud à offrir des capacités de calcul confidentiel pour sécuriser les charges de travail d’IA agentique dans tous les environnements, qu’ils soient Cloud ou hybrides.
Cette solution, qui s’appuie sur la plateforme NVIDIA HGX B200 équipée de GPU Blackwell et de NVIDIA Confidential Computing, permettra aux clients de protéger leurs modèles d’IA et leurs données. Les utilisateurs peuvent ainsi atteindre des performances et une efficacité énergétique révolutionnaires sans compromettre la sécurité des données ni l’intégrité du modèle.
Observabilité et sécurité de l’IA dans l’IA agentique
La mise à l’échelle de l’IA agentique en production nécessite une observabilité et une sécurité robustes qui garantit des performances fiables et assure le respect de la réglementation.
Google Cloud a annoncé aujourd’hui une nouvelle passerelle d’inférence GKE conçue pour optimiser le déploiement des charges de travail d’inférence de l’IA grâce à un routage et à une évolutivité avancés. Elle s’intègre au serveur d’inférence NVIDIA Triton et à NVIDIA NeMo Guardrails pour offrir un équilibrage intelligent de la charge qui améliore les performances et réduit les coûts de service tout en centralisant la sécurité et la gouvernance des modèles.
Google Cloud s’efforce d’améliorer à l’avenir l’observabilité des charges de travail d’IA agentique en intégrant NVIDIA Dynamo, une bibliothèque open source conçue pour servir et mettre à l’échelle les modèles d’IA de raisonnement dans les usines d’IA.
À Google Cloud Next, vous pouvez assister à une allocution spéciale de NVIDIA, découvrir des sessions, regarder des démonstrations et discuter avec des experts NVIDIA.