NVIDIA et Microsoft ont dévoilé aujourd’hui des intégrations de produits conçues pour faire progresser le développement complet de l’IA NVIDIA sur les plateformes et les applications Microsoft.
Lors de Microsoft Ignite, Microsoft a annoncé le lancement de la première version d’aperçu privée sur le cloud de la série Azure ND GB200 V6 VM, basée sur la plateforme NVIDIA Blackwell. Azure ND GB200 v6 sera une nouvelle série de machines virtuelles (VM) optimisées pour l’IA et combine la conception en rack NVIDIA GB200 NVL72 avec la mise en réseau InfiniBand NVIDIA Quantum.
En outre, Microsoft a révélé que les applications Azure Container sont désormais compatibles avec les GPU NVIDIA, pour un déploiement de l’IA simplifié et évolutif. De plus, la plateforme NVIDIA AI sur Azure comprend de nouveaux workflows de référence pour l’IA industrielle et un NVIDIA Omniverse Blueprint pour créer des visuels immersifs basés sur l’IA.
Lors d’Ignite, NVIDIA a également annoncé de petits modèles de langage (SLM) à destination des PC et stations de travail RTX accélérés par l’IA. De quoi améliorer les interactions avec les humains numériques et les assistants virtuels en les rendant plus réalistes.
NVIDIA Blackwell comme fondation de l’IA nouvelle génération sur Microsoft Azure
La nouvelle série Azure ND GB200 V6 VM de Microsoft exploitera les performances puissantes des puces NVIDIA GB200 Grace Blackwell Superchips associées à une mise en réseau InfiniBand NVIDIA Quantum avancée. Cette offre est optimisée pour les charges de travail de Deep Learning à grande échelle afin d’accélérer les avancées dans le traitement du langage naturel, la vision par ordinateur et bien plus encore.
La série de machines virtuelles basées sur Blackwell vient compléter les clusters d’IA Azure annoncés précédemment avec des VM ND H200 V5. De quoi bénéficier de plus de mémoire à haute bande passante pour une meilleure inférence de l’IA. Les machines virtuelles ND H200 V5 sont déjà utilisées par OpenAI pour améliorer ChatGPT.
Azure Container Apps permettent l’inférence de l’IA serverless grâce au calcul accéléré NVIDIA
Le calcul sans serveur offre aux développeurs d’applications d’IA une agilité accrue pour déployer, faire évoluer et itérer rapidement des applications sans se soucier de l’infrastructure sous-jacente. Ils peuvent ainsi se focaliser sur l’optimisation des modèles et l’amélioration des fonctionnalités tout en minimisant les coûts de fonctionnement.
La plateforme de conteneurs sans serveur Azure Container Apps simplifie le déploiement et la gestion d’applications basées sur des microservices en simplifiant l’infrastructure sous-jacente.
Azure Container Apps prend désormais en charge les charges de travail accélérées par NVIDIA avec des GPU serverless. De quoi permettre aux développeurs d’utiliser la puissance du calcul accéléré pour des applications d’inférence de l’IA en temps réel dans un environnement flexible, basé sur la consommation et sans serveur. Cette capacité simplifie les déploiements de l’IA à grande échelle tout en améliorant l’efficacité des ressources et les performances des applications sans avoir à en gérer l’infrastructure.
Les GPU serverless permettent aux équipes de développement de se focaliser davantage sur l’innovation et moins sur la gestion de l’infrastructure. Avec la facturation à la seconde et des capacités « scale-to-zero », les clients ne paient que pour les ressources de calcul utilisées, ce qui permet d’assurer une utilisation des ressources à la fois économique et efficace. NVIDIA collabore également avec Microsoft pour intégrer les microservices NVIDIA NIM aux GPU NVIDIA serverless dans Azure afin d’optimiser les performances des modèles d’IA.
NVIDIA dévoile des workflows de référence Omniverse pour les applications 3D avancées
NVIDIA a annoncé des workflows de référence qui aident les développeurs à créer des applications de simulation 3D et des jumeaux numériques sur NVIDIA Omniverse et Universal Scene Description (OpenUSD), . De quoi accélérer l’IA industrielle et faire progresser la créativité basée sur l’IA.
Un workflow de référence pour la surveillance 3D à distance des opérations industrielles sera bientôt disponible et permettra aux développeurs de relier des modèles 3D précis de systèmes industriels à des données en temps réel d’Azure IoT Operations et de Power BI.
Ces deux services Microsoft s’intègrent à des applications basées sur NVIDIA Omniverse et OpenUSD pour fournir des solutions pour des cas d’utilisation en IoT industriel. De quoi aider les équipes d’exploitation distantes à accélérer la prise de décision et à optimiser les processus dans les installations de production.
Omniverse Blueprint pour une IA générative visuelle précise permet aux développeurs de créer des applications à destination des équipes non techniques, pour leur permettre de générer des visuels améliorés par l’IA tout en préservant les ressources de la marque. Ce Blueprint prend en charge des modèles comme SDXL et Shutterstock Generative 3D pour simplifier la création d’images générées par l’IA en phase avec la marque.
De grands groupes créatifs, dont Accenture Song, Collective, GRIP, Monks et WPP, ont adopté ce NVIDIA Omniverse Blueprint pour personnaliser l’imagerie sur tous les marchés.
Accélérer l’IA générative pour Windows grâce aux PC avec AI RTX
La collaboration entre NVIDIA et Microsoft s’étend à l’intégration de capacités d’IA aux appareils informatiques personnels.
Lors d’Ignite, NVIDIA a annoncé la sortie de son nouveau SLM multimodal, NVIDIA Nemovision-4B Instruct, pour comprendre l’imagerie visuelle dans le monde réel et à l’écran. Elle sera bientôt disponible sur les PC et les stations de travail RTX accélérés par l’IA et ouvrira la voie à des interactions plus sophistiquées et plus réalistes avec les humains numériques.
De plus, les mises à jour de NVIDIA TensorRT Model Optimizer (ModelOpt) offrent aux développeurs Windows un moyen d’optimiser un modèle pour le déploiement sur ONNX Runtime. TensorRT ModelOpt permet aux développeurs de créer des modèles d’IA plus rapides et plus précis lorsqu’ils sont accélérés par des GPU RTX. Des modèles à destination des PC. Les grands modèles peuvent ainsi fonctionner dans les limites des environnements PC, et le déploiement par les développeurs sur l’écosystème PC avec ONNX Runtime est simplifié.
Les PC et les stations de travail RTX accélérés par l’IA offrent des outils de productivité, des applications créatives et des expériences immersives améliorées rendues possibles par le traitement local de l’IA.
Collaboration complète pour le développement de l’IA
Le vaste écosystème de partenaires et de développeurs de NVIDIA ajoute une abondance d’options d’IA et de calcul hautes performances à la plateforme Azure.
SoftServe, un fournisseur mondial de services de consulting informatique et numériques, a annoncé aujourd’hui la disponibilité sur la marketplace Azure de SoftServe Gen AI Industrial Assistant, basé sur le modèle d’IA de NVIDIA pour l’extraction multimodale de données PDF. L’assistant répond à certains défis critiques de la production industrielle en utilisant l’IA pour améliorer la maintenance de l’équipement et la productivité des employés.
Lors d’Ignite, AT&T présentera son utilisation de NVIDIA AI et d’Azure pour améliorer l’efficacité opérationnelle, stimuler la productivité des employés et renforcer la croissance de l’entreprise grâce à la génération augmentée par récupération et à des assistants et des agents autonomes.
Apprenez-en plus sur la collaboration et les sessions de NVIDIA et de Microsoft lors d’Ignite.
Voir l’avis concernant les informations relatives aux produits logiciels.