NVIDIA lance des données et des modèles ouverts pour accélérer l’innovation en matière d’IA dans les domaines du langage, de la biologie et de la robotique

Dans le cadre de son engagement en faveur de l’open-source, NVIDIA dévoile de nouvelles technologies d’IA open-source pour le langage, la robotique et la biologie, contribuant ainsi à un écosystème ouvert qui élargit l’accès à l’IA et favorise l’innovation aux États-Unis.

Ces technologies ouvertes offrent une plus grande latitude aux développeurs du monde entier et renforcent la croissance économique grâce à un raisonnement efficace, à une génération d’environnement à haute fidélité et à des systèmes d’IA physique interactifs accélérés sur l’infrastructure NVIDIA.

Les nouveaux modèles, données et outils ouverts font partie de la gamme NVIDIA Nemotron pour le raisonnement de l’IA, de la plateforme NVIDIA Cosmos pour l’IA physique, de NVIDIA Isaac GR00T pour la robotique et de NVIDIA Clara pour l’IA biomédicale.

NVIDIA contribue à Hugging Face avec ces modèles, données et frameworks d’entraînement pour rendre la recherche et le développement en IA plus accessibles. En tant que principal contributeur de Hugging Face, avec plus de 650 modèles ouverts et 250 jeux de données ouverts disponibles à ce jour, NVIDIA continue d’étendre l’accès aux ressources d’IA de pointe à la communauté mondiale des développeurs.

« Les modèles ouverts sont des catalyseurs de l’innovation en matière d’IA puisqu’ils la rendent accessible, transparente et responsable », explique Clément Delangue, PDG de Hugging Face. « Les contributions de NVIDIA à l’écosystème des modèles ouverts, son engagement en faveur de la recherche ouverte pour l’IA et l’écosystème de Hugging Face vont permettre à des millions de développeurs de concevoir une IA avancée de manière collaborative et ouverte. »

NVIDIA Nemotron dote les agents spécialisés en IA d’un raisonnement ultra-efficace

Les agents d’IA utilisent plusieurs modèles pour les processus de vision, de récupération, de génération et de raisonnement. Les nouveaux modèles ouverts de la gamme NVIDIA Nemotron unifient ces capacités, ce qui permet aux développeurs de concevoir des agents intelligents spécialisés.

Nemotron Nano 3 utilise une architecture hybride MoE (Mixture of Experts) pour améliorer le débit de raisonnement dans des domaines tels que le développement de logiciels, le service client et le support informatique.
Nemotron Nano 2 VL fournit des fonctions d’intelligence documentaire, de raisonnement d’image et d’analyse vidéo.
Nemotron Parse extrait du texte et des tableaux de documents pour obtenir des informations exploitables.
Nemotron Safety Guard ajoute des fonctionnalités de modération multilingue adaptées aux différentes cultures, détectant le contenu sensibles selon 23 critères de sécurité en neuf langues.
Les modèles de génération augmentée par récupération (RAG) proposent désormais une fonction d’extraction de documents avancée et de récupération unifiée pour les sources de données textuelles, graphiques, audio et vidéo.

NVIDIA a également publié de nouveaux jeux de données Nemotron open-source, notamment sur l’entraînement multimodal, les publics multilingues et les informations personnelles synthétiques préservant la vie privée, pour le développement de modèles spécialisés. En outre, de nouveaux outils de NVIDIA NeMo, dont NeMo Data Designer pour la génération de données synthétiques et NeMo-RL pour l’apprentissage post-entraînement et de renforcement avancé, octroient aux développeurs un meilleur contrôle sur la personnalisation des modèles.

Les principales sociétés de logiciels conçoivent leur IA agentique sur Nemotron

Les modèles open-source permettent aux développeurs de construire et d’adapter l’IA pour leurs domaines, transformant les logiciels en systèmes agentiques qui utilisent des outils et ne se contentent pas de les fournir. Les principales entreprises de logiciels et de services développent des plateformes logicielles agentiques à l’aide de NVIDIA Nemotron.

Fort du succès de la gamme de modèles Apriel Nemotron post-entraînés avec des données fournies par NVIDIA et ServiceNow, ServiceNow a présenté son nouveau modèle de raisonnement multimodal Apriel 2.0 qui fournit de l’intelligence aux workflows interentreprises dans tous les domaines, y compris les secteurs réglementés tels que les services financiers, les soins de santé et les télécommunications.

« Les modèles ouverts sont à l’origine de la nouvelle vague de transformation des entreprises », indique Joe Davis, vice-président exécutif de l’ingénierie des plateformes et de l’IA chez ServiceNow. « Apriel 2.0 représente l’un des premiers modèles de raisonnement multimodal ouvert conçus pour l’entreprise, étant donné qu’il combine la compréhension de textes, de documents et de données pour alimenter les workflows réels dans tous les secteurs. Avec NVIDIA, nous associons la transparence du raisonnement à l’efficacité des performances, tout en proposant une IA explicable, sécurisée et évolutive dans des secteurs où la confiance et la conformité priment. »

D’autres entreprises de logiciels de premier plan adoptent les nouveaux modèles de raisonnement de NVIDIA pour alimenter leurs applications d’IA de nouvelle génération: :

Palantir met Nemotron à disposition via son framework Ontology dans Foundry et AIP pour prendre en charge une pile technologique intégrée avec NVIDIA pour l’IA opérationnelle.
Cadence accélère la productivité des concepteurs de puces grâce à sa plateforme JedAI et aux technologies ouvertes de Nemotron.
CrowdStrike intègre des agents d’IA autonomes et en apprentissage continu à sa plateforme de sécurité agentique avec NVIDIA Nemotron.
PayPal augmente de 50 % le débit et l’efficacité de ses services d’IA grâce à Nemotron.
Synopsys collabore avec NVIDIA pour développer des agents de conception de puces à l’aide du kit d’outils NVIDIA NeMo Agent, ainsi que des données et modèles ouverts Nemotron utilisés par les ingénieurs de NVIDIA.
Zoom utilise Nemotron pour ses capacités agentiques personnalisées afin de s’aligner sur les workflows spécifiques de ses clients.

Données et modèles ouverts de Cosmos et Isaac GR00T pour l’IA physique et la robotique

Pour accélérer l’entraînement des systèmes robotiques avec un raisonnement et une fonction cognitive semblables à ceux des humains, NVIDIA a intégré des mises à jour majeures à ses modèles ouverts pour l’IA physique, notamment aux modèles de fondation de monde de Cosmos et aux modèles de fondation d’Isaac GR00T :

Cosmos Predict 2.5 : unifie trois modèles en un seul pour une simulation rapide du monde et générer des vidéos de 30 secondes à partir d’une seule image.
Cosmos Transfer 2.5 : produit des données photoréalistes de qualité supérieure à partir de scènes 3D d’un tiers de la taille prise en charge par Cosmos Transfer 1.
Cosmos Reason : modèle de langage de vision pour le raisonnement désormais disponible en tant que microservice NVIDIA NIM pour une compréhension multimodale avancée.
Cosmos Dataset Search : permet de récupérer instantanément des scénarios d’entraînement, réduisant ainsi les cycles post-entraînement de plusieurs mois à quelques jours.
Isaac GR00T N1.6 : améliore le raisonnement, la généralisation et le contrôle du corps entier pour les robots humanoïdes.

NVIDIA a également publié le plus grand jeu de données open-source au monde pour l’IA physique, qui comprend désormais 1 700 heures de données de capteurs de conduite multimodaux en provenance des États-Unis et d’Europe, ainsi que des données d’entraînement GR00T qui ont été classées parmi les 10 jeux de données Hugging Face les plus téléchargés de tous les temps.

De grandes entreprises comme Agility Robotics, Amazon Robotics, Figure AI, Skild AI, Milestone Systems et Uber adoptent des modèles Cosmos ou Isaac GR00T N pour générer des données synthétiques, enseigner de nouveaux comportements aux robots mais aussi déployer des agents réels et d’IA physique à grande échelle.

Modèles ouverts NVIDIA Clara pour la santé et les sciences de la vie

Parmi les nouveaux modèles ouverts qui rejoignent NVIDIA Clara, une gamme de modèles, d’outils et de recettes conçue pour accélérer les découvertes scientifiques, l’analyse d’images médicales et bien plus encore, on trouve :

Clara CodonFM: apprend les règles de l’ARN pour révéler comment les changements dans son code peuvent améliorer la conception des thérapies et de la médecine. NVIDIA va contribuer à la plateforme de cellules virtuelles de l’Initiative Chan Zuckerberg avec des modèles ouverts comme CodonFM afin d’accélérer la collaboration et l’évaluation des modèles open-source.
Clara La-Proteina : crée des structures protéiques 3D atome par atome qui sont deux fois plus longues et complexes que les modèles précédents, permettant la mise au point de médicaments, d’enzymes et de matériaux de meilleure qualité.
Clara Reason : modèle de langage de vision permettant un raisonnement en chaîne de pensée pour la radiologie et l’imagerie médicale afin de faire progresser la recherche médicale via l’IA explicable.

Lancez-vous avec les modèles ouverts NVIDIA

Certains modèles ouverts de NVIDIA Nemotron et Cosmos, entraînés sur NVIDIA DGX Cloud, sont disponibles sur build.nvidia.com, Hugging Face, OpenRouter et Microsoft Azure AI Foundry, et seront bientôt disponibles sur la plateforme Google Vertex AI et via d’autres fournisseurs de services Cloud. NVIDIA Clara et Isaac GR00T sont disponibles sur Hugging Face.

Ces modèles sont disponibles sous forme de microservices NVIDIA NIM pour un déploiement sécurisé et évolutif sur DGX Cloud ou toute autre infrastructure accélérée par NVIDIA pour une confidentialité et un contrôle maximaux.

Découvrez comment NVIDIA et ses partenaires font progresser l’innovation en matière d’IA aux États-Unis en assistant à la keynote de M. Huang à la NVIDIA GTC à Washington, D.C.