NVIDIA présente les familles de modèles Nemotron pour faire progresser l'IA agentique

L’intelligence artificielle entre dans une nouvelle ère, l’IA agentique, où des équipes d’agents spécialisés peuvent aider les personnes à résoudre des problèmes complexes et à automatiser des tâches répétitives.

Grâce aux agents d’IA personnalisés, les entreprises de tous les secteurs peuvent fabriquer de l’intelligence et atteindre une productivité sans précédent. Ces agents d’IA avancés nécessitent un système de plusieurs modèles d’IA générative optimisés pour les fonctions et capacités de l’IA agentique. Cette complexité signifie que le besoin de modèles puissants, efficaces et de niveau entreprise n’a jamais été aussi grand.

Pour fournir une base pour l’IA agentique d’entreprise, NVIDIA a annoncé aujourd’hui la famille de grands modèles de langage ouverts (LLM). Construits avec Llama, les modèles peuvent aider les développeurs à créer et à déployer des agents d’IA dans une gamme d’applications, notamment le support client, la détection de fraude, et

l’optimisation de la chaîne d’approvisionnement et de la gestion des stocks. Pour être efficaces, de nombreux agents d’IA ont besoin à la fois de compétences linguistiques et de

la capacité à percevoir le monde et à réagir avec les mesures appropriées.

Grâce aux nouveaux modèles de langage de vision (VLM) NVIDIA Cosmos Nemotron et aux microservices NVIDIA NIM pour la recherche et la synthèse vidéo, les développeurs peuvent créer des agents qui analysent et réagissent aux images et aux vidéos provenant de machines autonomes, d’hôpitaux, de magasins et d’entrepôts, ainsi que d’événements sportifs, de films et d’actualités. Pour les développeurs cherchant à générer des vidéos basées sur la physique pour la robotique et les véhicules autonomes, NVIDIA a annoncé aujourd’hui séparément les modèles de fondation NVIDIA Cosmos.

Les modèles ouverts Llama Nemotron optimisent l’efficacité du calcul et la précision des agents d’IA

Construits avec les modèles de fondation Llama, l’une des collections de modèles open source les plus populaires sur le marché, téléchargés plus de 650 millions de fois, les modèles NVIDIA Llama Nemotron fournissent des blocs de construction optimisés pour le développement d’agents d’IA. Cela s’appuie sur l’engagement de NVIDIA à développer des modèles de pointe, comme Llama 3.1 Nemotron 70B, désormais disponible via le catalogue d’API de NVIDIA.

Les modèles Llama Nemotron sont élagés et entraînés avec les dernières techniques de NVIDIA et des ensembles de données de haute qualité pour des capacités agentiques améliorées. Ils excellent dans le suivi des instructions, le chat, les appels de fonctions, le codage et les mathématiques, tout en étant optimisés pour fonctionner sur un large éventail de ressources informatiques accélérées NVIDIA.

« L’IA agentique représente la prochaine frontière du développement de l’IA et exploiter cette opportunité nécessite une optimisation complète via un système de LLM pour fournir des agents d’IA efficaces et précis, a déclaré Ahmad Al-Dahle, vice-président et responsable de GenAI chez Meta. « Grâce à notre collaboration avec NVIDIA et à notre engagement commun envers les modèles ouverts, la famille NVIDIA Llama Nemotron construite sur Llama peut aider les entreprises à créer rapidement leurs propres agents d’IA personnalisés. »

Les principaux fournisseurs de plateformes d’IA, dont SAP et ServiceNow, devraient être parmi les premiers à utiliser les nouveaux modèles Llama Nemotron.

« Les agents d’IA qui collaborent pour résoudre des tâches complexes dans plusieurs secteurs d’activité débloqueront un tout nouveau niveau de productivité de l’entreprise au-delà des scénarios d’IA générative d’aujourd’hui, a déclaré Philipp Herzig, directeur de l’IA chez SAP. Grâce à Joule, des centaines de millions d’utilisateurs d’entreprise interagiront avec ces agents pour atteindre leurs objectifs plus rapidement que jamais. La nouvelle famille de modèles ouverts Llama Nemotron de NVIDIA favorisera le développement de plusieurs agents d’IA spécialisés pour transformer les processus commerciaux. »

« Les agents d’IA permettent aux organisations d’obtenir plus avec moins d’effort, en établissant de nouvelles normes pour la transformation des affaires, a déclaré Jeremy Barnes, vice-président de l’IA sur les plateformes chez ServiceNow. Les performances et la précision améliorées des modèles ouverts Llama Nemotron peuvent aider à créer des services d’IA avancés qui résolvent des problèmes complexes dans tous les secteurs. »

Les modèles NVIDIA Llama Nemotron utilisent Nemotron pour la distillation, l’élagage et l’alignement. Grâce à ces techniques, les modèles sont suffisamment petits pour fonctionner sur une variété de plateformes informatiques tout en offrant une précision élevée et un débit accru.

La famille de modèles Llama Nemotron sera disponible sous forme de modèles téléchargeables et sous forme de microservices NVIDIA NIM qui peuvent être facilement déployés sur le cloud, les centres de données, PC et les stations de travail. Ils offrent aux entreprises des performances de pointe avec une intégration fiable, sécurisée et transparente dans leurs workflows d’IA agentique.

Personnalisez et connectez-vous aux connaissances métier avec NVIDIA NeMo

Les familles de modèles Ll’IA en tailles Nemotron arrivent en taille Nano, Super et Ultra pour offrir des options de déploiement d’agents d’IA à toutes les échelles.

Nano : le modèle le plus rentable optimisé pour les applications en temps réel avec une faible latence, idéal pour le déploiement sur PC et périphériques Edge.
Super : Un modèle de haute précision offrant un débit exceptionnel sur un seul GPU.
Ultra : le modèle le plus précis, conçu pour les applications à l’échelle des Data Centers exigeant les meilleures performances.

Les entreprises peuvent également personnaliser les modèles pour leurs cas d’utilisation et domaines spécifiques avec les microservices NVIDIA NeMo afin de simplifier la conservation des données, d’accélérer la personnalisation et l’évaluation des modèles et d’appliquer des garde-fous pour maintenir les réponses sur la bonne voie.

Avec NVIDIA NeMo Retriever, les développeurs peuvent également intégrer des capacités de génération augmentée par récupération pour connecter les modèles à leurs données d’entreprise.

Et en utilisant NVIDIA Blueprints pour l’IA agentique, les entreprises peuvent rapidement créer leurs propres applications à l’aide des outils avancés d’IA et de l’expertise en développement de bout en bout de NVIDIA. En fait, NVIDIA Cosmos Nemotron, NVIDIA Llama Nemotron et NeMo Retriever améliorent le nouveau NVIDIA Blueprint pour la recherche et le résumé vidéo, annoncé séparément aujourd’hui.

NeMo, NeMo Retriever et NVIDIA Blueprints sont tous disponibles avec la plateforme logicielle NVIDIA AI Enterprise.

Disponibilité

Les modèles Llama Nemotron et Cosmos Nemotron seront bientôt disponibles sous forme d’interfaces de programmation d’applications hébergées et téléchargeables sur build.nvidia.com et Hugging Face. L’accès pour le développement, les tests et la recherche est gratuit pour les membres du programme de développement de NVIDIA.

Les entreprises peuvent exécuter les microservices NIM Llama Nemotron et Cosmos Nemotron en production avec la plateforme logicielle NVIDIA AI Enterprise sur un data center accéléré et une infrastructure cloud.

Inscrivez-vous pour recevoir des notifications sur les modèles Llama Nemotron et Cosmos Nemotron et rejoignez NVIDIA au CES.

Voir l‘avis concernant les informations sur les produits logiciels.