Présentation de NVIDIA Nemotron 3 : des modèles ouverts pour l'IA multi-agents

NVIDIA rend l’IA avancée accessible avec le lancement de la gamme de modèles, de données et de bibliothèques ouverts Nemotron 3, conçue pour aider les développeurs à créer la prochaine génération d’agents IA spécialisés. Les modèles Nemotron 3, disponibles en versions Nano, Super et Ultra, introduisent une architecture hybride révolutionnaire de type “mixture-of-experts” (MoE) qui aide les développeurs à créer et à déployer des systèmes multi-agents fiables à grande échelle. Avec Nemotron 3, NVIDIA est la première à proposer une collection de modèles ouverts de pointe, de jeux de données d’entraînement et d’environnements et de bibliothèques d’apprentissage par renforcement pour créer des agents IA spécialisés, hautement précis et efficaces.

Nouveautés de Nemotron 3

À mesure que les organisations passent des chatbots à modèle unique aux systèmes d’IA multi-agents collaboratifs, les défis se multiplient : surcoût de communication, dérive contextuelle et coûts d’inférence croissants. Les développeurs ont besoin de transparence pour faire confiance aux modèles qui automatisent leurs flux de travail. Nemotron 3 répond directement à ces exigences.

La famille Nemotron 3 comprend trois tailles de modèles :

Nemotron 3 Nano : un petit modèle de 30 milliards de paramètres qui active jusqu’à 3 milliards de paramètres pour des tâches ciblées et hautement efficaces.
Nemotron 3 Super : un modèle de raisonnement de haute précision avec environ 100 milliards de paramètres et 10 milliards de paramètres actifs par token, destiné aux applications multi-agents.
Nemotron 3 Ultra : un moteur de raisonnement de grande envergure avec environ 500 milliards de paramètres et 50 milliards activés par token, destiné aux applications d’IA complexes.

Super et Ultra utilisent tous deux le format d’entraînement NVFP4 4 bits ultra-efficace de NVIDIA sur l’architecture NVIDIA Blackwell, ce qui réduit considérablement les besoins en mémoire et accélère l’entraînement tout en conservant une précision équivalente à celle des formats de plus haute précision.

Une efficacité qui compte

Nemotron 3 Nano est conçu pour des déploiements dans le monde réel où l’efficacité a un impact direct sur les résultats financiers. Le modèle permet d’obtenir :

Un débit de tokens 4 fois supérieur à celui de Nemotron 2 Nano, offrant le plus grand nombre de tokens par seconde pour les systèmes multi-agents à grande échelle
Jusqu’à 60 % de tokens de raisonnement en moins, ce qui réduit considérablement les coûts d’inférence
Une fenêtre contextuelle d’un million de tokens, permettant un raisonnement à long terme plus précis et une meilleure capacité à relier les informations sur des tâches longues et en plusieurs étapes
Le plus ouvert et le plus efficace parmi les modèles de même taille, selon les benchmarks indépendants d’Artificial Analysis, avec une précision de pointe

Cela signifie que les développeurs peuvent déployer plus d’agents, gérer des conversations plus longues et réduire les coûts d’infrastructure, le tout sans sacrifier la précision.

Une approche ouverte du développement de l’IA

Nous pensons que l’innovation ouverte est le moteur du progrès dans le secteur de l’IA. C’est pourquoi Nemotron 3 est livré avec une boîte à outils complète pour les développeurs.

Les trois mille milliards de jetons des nouveaux ensembles de données Nemotron de pré-entraînement, de post-entraînement et d’apprentissage par renforcement fournissent les exemples riches de raisonnement, de codage et de flux de travail en plusieurs étapes nécessaires pour créer des agents hautement performants et spécialisés dans un domaine particulier. L’ensemble de données Nemotron Agentic Safety Dataset fournit des données télémétriques réelles pour aider les équipes à évaluer et à renforcer la sécurité des systèmes d’agents complexes.

Afin d’accélérer le développement, nous avons publié les bibliothèques open source NeMo Gym et NeMo RL, qui fournissent les environnements de formation et les bases post-formation pour les modèles Nemotron, ainsi que NeMo Evaluator pour valider la sécurité et les performances des modèles. Tous les outils et ensembles de données sont désormais disponibles sur GitHub et Hugging Face.

Nemotron 3 est pris en charge par LM Studio,llama.cpp, SGLang et vLLM. De plus, Prime Intellect et Unsloth intègrent les environnements de formation prêts à l’emploi de NeMo Gym directement dans leurs flux de travail, offrant ainsi aux équipes un accès plus rapide et plus facile à une formation puissante en apprentissage par renforcement.

Nemotron 3 déjà adopté par des acteurs du secteur

Les premiers utilisateurs, notamment Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens et Zoom, intègrent les modèles de la famille Nemotron pour alimenter les workflows d’IA dans les secteurs de la fabrication, de la cybersécurité, du développement logiciel, des médias, des communications et d’autres industries.

« NVIDIA et ServiceNow façonnent l’avenir de l’IA depuis des années, et le meilleur reste à venir », déclare Bill McDermott, président-directeur général de ServiceNow. « Aujourd’hui, nous faisons un grand pas en avant en donnant aux dirigeants de tous les secteurs les moyens d’accélérer leur stratégie d’IA agentielle. L’automatisation intelligente des flux de travail de ServiceNow, combinée à Nemotron 3 de NVIDIA, continuera à définir la norme avec une efficacité, une rapidité et une précision inégalées. »

Démarrer avec les modèles ouverts NVIDIA

Nemotron 3 Nano est disponible dès aujourd’hui sur Hugging Face et auprès de fournisseurs de services d’inférence tels que Baseten, Deepinfra, Fireworks, FriendliAI, OpenRouter et Together AI.

Nemotron est proposé sur les plateformes d’IA et d’infrastructure de données d’entreprise, notamment Couchbase, DataRobot, H2O.ai, JFrog, Lambda et UiPath. Pour les clients utilisant des clouds publics, Nemotron 3 Nano sera disponible sur AWS via Amazon Bedrock (serverless) et sera bientôt pris en charge sur Google Cloud, Coreweave, Nebius, Nscale et Yotta.

Nemotron 3 Nano est disponible sous forme de microservice NVIDIA NIM™ pour un déploiement sécurisé et évolutif partout sur l’infrastructure accélérée par NVIDIA, pour une confidentialité et un contrôle accrus. Nemotron 3 Super et Ultra devraient être disponibles au cours du premier semestre 2026.