Secret de Polichinelle : comment les modèles, les jeux de données et les techniques NVIDIA Nemotron stimulent le développement de l’IA

La collection de technologies open source Nemotron permet aux développeurs et aux entreprises de développer une intelligence puissante, tant généralisée que spécialisée.
by Bryan Catanzaro

Les technologies ouvertes, mises à la disposition des développeurs et des entreprises pour leur permettre d’adopter, de modifier et d’innover, ont fait partie de toutes les mutations technologiques majeures, de la naissance d’internet aux premiers jours du cloud computing. L’IA devrait suivre la même voie.

C’est pourquoi la gamme de modèles, de jeux de données et de techniques d’IA multimodale NVIDIA Nemotron est disponible en toute ouverture. Accessible pour la recherche et pour une utilisation commerciale, des PC locaux aux systèmes d’entreprise, Nemotron fournit une base ouverte pour le développement d’applications d’IA. Il est disponible pour les développeurs afin de démarrer sur GitHub, Hugging Face et OpenRouter.

Nemotron permet aux développeurs, aux startups et aux entreprises de toutes tailles d’utiliser des modèles entraînés avec des données d’entraînement transparentes et open-source. Il offre des outils pour accélérer chaque phase du développement, de la personnalisation au déploiement.

Cette transparence permet à ceux qui l’adoptent de comprendre le fonctionnement de leurs modèles et de faire confiance aux résultats qu’ils fournissent.

Les capacités de Nemotron en matière d’intelligence généralisée et de raisonnement avec l’IA agentique, ainsi que son adaptabilité à des cas d’utilisation spécialisés, ont permis à cette plateforme d’être aujourd’hui largement utilisée par les innovateurs en IA et les leaders de secteurs tels que la fabrication, la santé, l’éducation et la vente au détail.

Qu’est-ce que NVIDIA Nemotron ?

NVIDIA Nemotron est une collection de technologies d’IA open source conçues pour accélérer efficacement le développement de l’IA à tous les stades. Elle inclut :

  • Modèles multimodaux : modèles d’IA de pointe basés sur des points de contrôle ouverts qui excellent en matière de raisonnement scientifique au niveau des diplômés, de mathématiques avancées, de codage, de suivi d’instructions, d’appel d’outils et de raisonnement visuel.
  • Pré-entraînement, post-entraînement et jeux de données multimodaux : collections de données textuelles, d’images et de données vidéo soigneusement choisies qui enseignent des compétences aux modèles d’IA, notamment le langage, les mathématiques et la résolution de problèmes.
  • Algorithmes et recettes de précision numérique : techniques de précision avancées qui rendent l’IA plus rapide et plus économique à exécuter, tout en garantissant la précision des réponses.
  • Logiciel système pour une mise à l’échelle efficace de l’entraînement sur des clusters GPU : logiciels et frameworks optimisés qui permettent d’accélérer l’entraînement et l’inférence sur des GPU NVIDIA à grande échelle pour les plus grands modèles.
  • Méthodologies et logiciels de post-entraînement : affinage des étapes qui rendent l’IA plus intelligente, plus sûre et meilleure pour des tâches spécifiques.

Nemotron fait partie des efforts plus larges de NVIDIA visant à fournir des plateformes d’IA ouvertes, transparentes et adaptables aux développeurs, aux leaders de l’industrie et aux concepteurs d’infrastructures d’IA dans les secteurs privé et public.

Quelle est la différence entre l’intelligence généralisée et l’intelligence spécialisée ?

NVIDIA a développé Nemotron pour améliorer les capacités d’intelligence généralisée, notamment en matière de raisonnement avec l’IA, tout en accélérant la spécialisation et en aidant les entreprises du monde entier à adopter l’IA pour relever des défis spécifiques à un secteur.

L’intelligence généralisée fait référence à des modèles entraînés sur de vastes jeux de données publiques pour effectuer une large gamme de tâches. L’intelligence spécialisée apprend le langage, les processus et les priorités uniques d’un secteur ou d’une organisation, permettant aux modèles d’IA de s’adapter à des applications réelles spécifiques.

Pour fournir l’IA à grande échelle dans tous les secteurs, les deux sont essentiels.

C’est pourquoi Nemotron fournit des modèles de fondation pré-entraînés et optimisés pour une gamme de plateformes de calcul, ainsi que des outils tels que NVIDIA NeMo et NVIDIA Dynamo pour transformer les modèles d’IA généralisés en modèles personnalisés adaptés à une intelligence spécialisée.

Comment les développeurs et les entreprises utilisent-ils Nemotron ?

NVIDIA conçoit Nemotron pour accélérer le travail des développeurs partout dans le monde et éclairer la conception des futurs systèmes d’IA.

Des chercheurs aux startups en passant par les entreprises internationales, les développeurs ont besoin d’une IA flexible et fiable. Nemotron offre les outils nécessaires pour construire, personnaliser et intégrer l’IA dans pratiquement tous les domaines.

  • CrowdStrike intègre à Nemotron sa plateforme sans code Charlotte AI AgentWorks pour les équipes de sécurité, afin de contribuer à alimenter et à sécuriser l’écosystème agentique. Cette collaboration redéfinit les opérations de sécurité en permettant aux analystes de développer et de déployer des agents d’IA spécialisés à grande échelle, en s’appuyant sur une sécurité fiable et de niveau entreprise avec les modèles Nemotron.
  • DataRobot utilise Nemotron comme fondation ouverte pour entraîner, personnaliser et gérer les agents d’IA à grande échelle grâce à la plateforme de travail d’agents co-développée avec NVIDIA, une solution pour développer, exploiter et gouverner une main-d’œuvre d’agents d’IA entièrement fonctionnelle dans des environnements sur site, hybrides et multi-Cloud.
  • ServiceNow a présenté le modèle Apriel Nemotron 15B plus tôt cette année en partenariat avec NVIDIA. Post-entraîné à l’aide des données des deux entreprises, ce modèle est spécialement conçu pour l’exécution de workflows en temps réel et permet d’obtenir un raisonnement avancé dans une taille plus petite, ce qui le rend plus rapide, plus efficace et plus rentable.
  • UK-LLM, une initiative d’IA souveraine menée par l’University College London, a utilisé les techniques et les jeux de données open source Nemotron pour développer un modèle de raisonnement d’IA pour l’anglais et le gallois.

NVIDIA utilise également les enseignements tirés du développement de Nemotron pour éclairer la conception de ses systèmes de nouvelle génération, notamment Grace Blackwell, Vera Rubin et Feynman. Les dernières innovations en matière de modèles d’IA, notamment la précision réduite, l’arithmétique éparse, les nouveaux mécanismes d’attention et les algorithmes d’optimisation, façonnent toutes les architectures de GPU.

Par exemple, NVFP4, un nouveau format de données qui n’utilise que quatre bits par paramètre lors de l’entraînement de grands modèles de langage (LLM), a été découvert avec Nemotron. Cette avancée, qui réduit considérablement la consommation énergétique, influence la conception de futurs systèmes NVIDIA.

NVIDIA améliore également Nemotron grâce à des technologies ouvertes développées par la communauté de l’IA au sens large.

    • Le modèle ouvert Qwen d’Alibaba a fourni une augmentation des données qui a permis d’améliorer les jeux de données de pré-entraînement et de post-entraînement de Nemotron. La dernière architecture Qwen3-Next a repoussé la frontière de l’IA à long contexte, en exploitant les réseaux Gated-Delta issus de NVIDIA Research et du MIT.
    • DeepSeek R1, une entreprise pionnière en matière de raisonnement par l’IA, a permis d’élaborer des jeux de données Nemotron ouverts en matière de mathématiques, de code et de raisonnement qui peuvent être utilisés pour enseigner aux modèles comment penser.
    • Les modèles GPT-oss à poids ouvert d’OpenAI démontrent des capacités de raisonnement incroyables, en mathématiques et en appel d’outils, notamment des paramètres de raisonnement ajustables, qui peuvent être utilisés pour renforcer les jeux de données de post-entraînement Nemotron.
    • La collection Llama de modèles ouverts par Meta constitue la base de Llama-Nemotron, une famille de modèles ouverte qui utilise les jeux de données et les recettes de Nemotron pour ajouter des capacités de raisonnement avancées.

Commencez à entraîner et à personnaliser des modèles d’IA et des agents avec les modèles et les données NVIDIA Nemotron sur Hugging Face, ou essayez gratuitement ces modèles sur OpenRouter. Les développeurs qui utilisent des PC NVIDIA RTX peuvent accéder à Nemotron via le framework llama.cpp.

Rejoignez NVIDIA pour la Journée de l’IA agentique à la NVIDIA GTC à Washington, D.C., le mercredi 29 octobre. Cet événement réunira des développeurs, des chercheurs et des leaders technologiques pour mettre en avant comment les technologies de NVIDIA accélèrent les priorités nationales en matière d’IA et alimentent la nouvelle génération d’agents d’IA.

Restez au courant de l’IA agentique, de Nemotron et d’autres aspects en vous abonnant à l’actualité des développeurs de NVIDIA, en rejoignant la communauté des développeurs et en suivant NVIDIA AI sur LinkedIn, Instagram, X et Facebook.