NVIDIA Nemotron 3 Ultra est disponible, avec comme premiers utilisateurs Perplexity, Palantir et ServiceNow pour alimenter des agents d’IA à exécution longue

NVIDIA a publié aujourd’hui Nemotron 3 Ultra, un modèle ouvert conçu pour les agents à exécution longue avec les contributions de la Nemotron Coalition.

Les modèles qui alimentent les agents à exécution longue font plus que générer du texte. Ils interprètent les informations, planifient les prochaines étapes, appellent des outils, évaluent les résultats et itèrent au fil des échanges afin de mener à bien des tâches complexes de codage, de recherche et d’entreprise. Cela exige des modèles efficaces, capables d’explorer une plus grande partie de l’espace de recherche en moins de temps afin de fournir plus rapidement des résultats plus précis.

Nemotron 3 Ultra est conçu pour cette nouvelle charge de travail. C’est un modèle intelligent de pointe qui offre une inférence jusqu’à 5 fois plus rapide et réduit le coût des tâches agentiques complexes jusqu’à 30 %. Les agents peuvent ainsi terminer le même travail en moins de temps, ou accomplir davantage de tâches dans le même délai.

Nemotron 3 Ultra, un modèle à mélange d’experts de 550 milliards de paramètres, gère l’orchestration et les appels de raisonnement les plus complexes dans un workflow autonome : décisions architecturales lors de longues sessions de codage, synthèse de centaines de sources de recherche et vérification de milliers de contraintes interdépendantes.

Des leaders du logiciel d’entreprise conçoivent des agents avec le nouveau modèle, notamment pour des workflows couvrant le développement logiciel, la recherche approfondie, le service client et les automatisations d’entreprise.

Aible intègre Nemtoron 3 Ultra à la plateforme AIbleClaw, permettant à ses clients de créer à grande échelle des agents sécurisés à exécution longue pour divers domaines.
Glean rend Nemotron 3 Ultra disponible dans son cadre d’exécution d’agents indépendant du modèle, aux côtés d’un modèle de recherche agentique affiné avec Nemotron 3 Nano, élargissant l’accès des entreprises à une IA agentique d’entreprise rentable.
Greptile intègre Nemotron 3 Ultra à sa plateforme de revue de code pour l’indexation des bases de code, permettant des revues de code d’une précision de tout premier plan à moindre coût.
Harvey prend en charge Nemotron 3 Ultra et des versions post-entraînées du modèle via sa plateforme, aidant les clients à créer et déployer des workflows juridiques optimisés par l’IA avec un meilleur contrôle de leurs données.
Perplexity utilise Nemotron 3 Ultra pour la recherche et Perplexity Computer, ainsi que son routeur d’agents pour orienter les charges de travail vers des modèles ouverts affinés ou des modèles propriétaires selon la tâche, aidant ses assistants IA à fonctionner avec rapidité, efficacité et à grande échelle.

Annoncé plus tôt cette semaine, CrowdStrike et Palantir adoptent Nemotron 3 Ultra afin de permettre à une nouvelle catégorie d’agents IA à exécution longue d’aider les équipes à analyser des données complexes, coordonner des tâches et rationaliser les opérations dans les environnements de cybersécurité et d’entreprise.

Parmi les autres entreprises qui adoptent le modèle figurent Applied Compute, CodeRabbit, Dataiku et ServiceNow.

Le modèle est entraîné sur des traces d’agents et optimisé pour les cadres d’exécution d’agents, ce qui permet aux développeurs de choisir leurs frameworks préférés tout en maintenant la précision.

Les plateformes et cadres d’exécution d’agents, notamment BlackBox AI, Cline, Factory AI, Hermes Agent, Kilo Code, LangChain Deep Agents, OpenClaw, OpenCode, OpenHands et Pi, prennent en charge les nouveaux modèles Nemotron.

Nemotron 3 Ultra fonctionne avec le blueprint NVIDIA NemoClaw, qui fournit aux entreprises un environnement d’exécution sécurisé, des modèles ouverts et des compétences propres à chaque domaine pour mettre les agents autonomes au travail à grande échelle.

H Company, Naver, Nous et Prime Intellect rejoignent la Nemotron Coalition

H Company, NAVER Cloud, Nous Research et Prime Intellect rejoignent la Nemotron Coalition. Ces membres apporteront des atouts uniques couvrant les données, les environnements d’entraînement, les cadres d’évaluation et l’expertise sectorielle afin de soutenir le développement collaboratif d’un modèle de pointe ouvert entraîné sur NVIDIA DGX Cloud, qui servira de fondation à la future famille Nemotron 4.

En unissant leurs forces, les membres de la coalition rassemblent des laboratoires d’IA et des fournisseurs d’infrastructure de premier plan à l’échelle mondiale pour accélérer le développement de modèles de pointe ouverts. Cette approche collaborative vise à élargir l’accès à l’innovation IA de pointe, tout en permettant aux développeurs et aux entreprises du monde entier de créer et de personnaliser des modèles pour leurs secteurs, régions et cas d’utilisation.

Nouveaux modèles Nemotron Speech et Safety

Également disponible aujourd’hui, un nouveau modèle Nemotron de reconnaissance vocale apporte l’ASR en streaming en temps réel à 40 variantes linguistiques pour les workflows d’agents vocaux dans les déploiements d’entreprise mondiaux. Le modèle Nemotron 3.5 Content Safety — un modèle multimodal ouvert de 4 milliards de paramètres — classe le contenu dans 23 catégories de sécurité et une douzaine de langues, avec prise en charge des politiques d’entreprise personnalisées.

Ouvert et personnalisable, déployable partout

Les modèles Nemotron sont publiés avec des poids, des jeux de données et des protocoles ouverts, offrant aux organisations la transparence et le contrôle nécessaires pour personnaliser les modèles en fonction de workflows propres à un domaine et les déployer là où résident leurs applications et leurs données.

Les développeurs peuvent utiliser des outils tels que NVIDIA NeMo pour la personnalisation, l’évaluation et l’optimisation en fonction de leurs cas d’utilisation. La famille de modèles Nemotron étant ouverte, les organisations peuvent les déployer dans des environnements répondant aux exigences réglementaires, de souveraineté ou de localisation des données.

Les modèles sont disponibles sur Hugging Face, ModelScope, OpenRouter et build.nvidia.com en tant que microservices NVIDIA NIM et via un vaste écosystème de NVIDIA Cloud Partners, de plateformes d’inférence et de fournisseurs de services cloud.