Note de l’éditeur : cet article fait partie de la série de blog Nemotron Labs qui explore comment les derniers modèles, ensembles de données et techniques d’entraînement ouverts aident les entreprises à créer des systèmes et des applications d’IA spécialisés sur les plateformes NVIDIA. Chaque article met en avant des moyens pratiques d’utiliser une pile ouverte pour créer de la valeur en production, des copilotes de recherche transparents aux agents d’IA évolutifs.
Au début de l’année 2026, le projet open source OpenClaw était devenu un phénomène. En janvier, son nombre d’étoiles GitHub a dépassé les 100 000 tandis que l’intérêt des développeurs augmentait. Les tableaux de bord communautaires et l’analyse de trafic ont montré plus de 2 millions de visiteurs en une seule semaine. En mars, OpenClaw a dépassé les 250 000 étoiles, dépassant React pour devenir le projet logiciel le plus étoilé sur GitHub en seulement 60 jours.

Créé par Peter Steinberger, OpenClaw est un assistant d’IA persistant auto-hébergé conçu pour s’exécuter en local ou sur des serveurs privés. Le projet a attiré l’attention par son accessibilité et son autonomie illimitée : les utilisateurs pouvaient déployer un modèle d’IA localement sans dépendre d’une infrastructure Cloud ou d’interfaces de programmation d’applications (API) externes.
La plupart des agents d’IA sont aujourd’hui déclenchés par une invite, effectuent une tâche définie, puis cessent de s’exécuter. Un agent autonome de longue durée, ou « claw », fonctionne différemment. Ces agents s’exécutent de manière persistante en arrière-plan, effectuant des tâches de manière autonome et exposant uniquement ce qui nécessite une décision humaine. Ils fonctionnent selon un signal de pulsation : à intervalles réguliers, ils vérifient leur liste de tâches, évaluent ce qui nécessite une action et agissent ou attendent le cycle suivant.
L’adoption rapide d’OpenClaw a également suscité un débat. Les chercheurs en sécurité ont soulevé des préoccupations sur la façon dont les outils d’IA auto-hébergés gèrent les données sensibles, l’authentification et les mises à jour des modèles. D’autres se sont demandés si les déploiements locaux pouvaient exposer les utilisateurs à de nouveaux risques, des instances de serveur non corrigées aux contributions malveillantes dans les forks communautaires. Alors que les contributeurs et les mainteneurs ont travaillé pour résoudre ces problèmes, l’ascension d’OpenClaw a incité à engager une conversation plus large dans l’ensemble de l’écosystème d’IA sur les compromis entre ouverture, confidentialité et sécurité.
Pour contribuer à améliorer la sécurité et la robustesse du projet OpenClaw, NVIDIA collabore avec Steinberger et la communauté de développeurs OpenClaw pour répondre aux vulnérabilités potentielles, comme l’a expliqué OpenClaw dans un article de blog récent.
NVIDIA fournit du code et des conseils axés sur l’amélioration de l’isolation des modèles, la meilleure gestion de l’accès aux données locales et le renforcement des processus de vérification des contributions de code communautaire. L’objectif est de soutenir l’élan du projet en contribuant avec son expertise en matière de sécurité et de systèmes de manière ouverte et transparente qui renforce le travail de la communauté tout en préservant la gouvernance indépendante d’OpenClaw.
Pour rendre les agents à long terme plus sûrs pour les entreprises, NVIDIA a également présenté NVIDIA NemoClaw, une implémentation de référence qui utilise une seule commande pour installer OpenClaw, l’environnement d’exécution sécurisé NVIDIA OpenShell et les modèles ouverts NVIDIA Nemotron avec des paramètres par défaut renforcés pour la mise en réseau, l’accès aux données et la sécurité. NemoClaw sert de modèle aux entreprises pour déployer des claws de manière plus sécurisée.
La demande d’inférence se multiplie avec chaque vague d’IA
L’IA est passée par quatre phases, et l’intervalle entre chacune se raccourcit. L’IA prédictive a mis des années pour se généraliser. L’IA générative a évolué plus rapidement. L’IA de raisonnement est arrivée encore plus rapidement. L’IA autonome — la vague que représente OpenClaw — impose un rythme encore plus soutenu.
Ce qui s’accroît avec chaque vague, c’est la demande d’inférence. L’IA générative a augmenté l’utilisation des jetons par rapport à l’IA prédictive. L’IA de raisonnement l’a encore multiplié par 100. Les agents autonomes, qui s’exécutent en continu et agissent sur de longs horizons temporels, multiplient par 1 000 la demande d’inférence par rapport à l’IA de raisonnement. Chaque vague multiplie le calcul nécessaire.

Cette augmentation de l’utilisation des jetons permet aux organisations d’accélérer leur productivité par ordres de grandeur. Par exemple, les agents à exécution longue peuvent aider les chercheurs à résoudre un problème du jour au lendemain, à itérer sur une conception à travers des milliers de configurations, ou à surveiller des systèmes et à ne faire apparaître que les anomalies qui nécessitent un jugement humain — libérant ainsi les journées de travail des chercheurs pour des tâches à plus forte valeur ajoutée.
Choix de l’outil : quand déployer un « Claw »
Alors que l’IA générative est devenue un élément de base pour les tâches à la demande, il existe des scénarios spécifiques où le mode de fonctionnement d’un claw offre des avantages distincts. Dterminer quand passer d’une IA standard basée sur des invites vers un agent à excution longue dépend souvent de la nature du workflow:
- Du « On-Demand » au « Always-on »: alors que les modèles standards sont excellents pour les requêtes immédiates déclenchées par l’homme, les claws sont souvent mieux adaptées aux tâches nécessitant une surveillance continue en arrière-plan ou des contrôles périodiques du système sans nécessiter de démarrage manuel.
- Gestion des boucles à itération élevée: pour les problèmes complexes, tels que tester des milliers de combinaisons chimiques ou simuler des tests de résistance d’infrastructure, un claw peut gérer le volume considérable d’itérations qui pourraient autrement être limitées par un goulot d’étranglement lié à l’intervention humaine.
- Passage des suggestions aux actions: dans de nombreux workflows, l’IA standard est utilisée pour fournir des informations ou des ébauches. Un claw est souvent envisagé lorsque l’objectif est que l’IA passe de la phase d’exécution — interagir avec les API, mettre à jour les bases de données ou gérer des fichiers sur un long horizon temporel.
- Optimisation des ressources : pour les tâches de raisonnement massives et lourdes en jetons, le déploiement d’une claw locale sur du matériel dédié tel que le supercalculateur d’IA personnel NVIDIA DGX Spark permet d’obtenir des coûts plus prévisibles et de protéger la confidentialité des données par rapport aux appels d’API Cloud à haute fréquence.
Comment les entreprises utilisent-elles des agents autonomes de longue durée ?
Les applications pratiques des agents autonomes de longue durée couvrent toutes les fonctions et secteurs.
Dans le domaine des services financiers, les agents surveillent en continu les systèmes de trading et les flux réglementaires, signalant les événements importants avant la revue du matin. Dans la découverte de médicaments, les agents balayent la nouvelle littérature scientifique, extraient les résultats pertinents et mettent à jour les bases de données internes en temps réel sans l’intervention des chercheurs — un processus qui prenait auparavant des semaines.
Dans l’ingénierie et la fabrication, les agents accélèrent l’analyse des problèmes en testant des milliers de combinaisons de paramètres, en classant les résultats et en signalant les configurations intéressantes — et tout cela peut se produire du jour au lendemain.
Dans les opérations informatiques, les agents diagnostiquent les incidents d’infrastructure, appliquent des mesures correctives connues et ne font passer que les nouveaux problèmes, réduisant le délai moyen de résolution de quelques heures à quelques minutes. Chez ServiceNow, les spécialistes en IA exploitant les modèles Apriel et NVIDIA Nemotron peuvent résoudre 90 % des tickets de manière autonome.
Comment les entreprises peuvent-elles déployer des agents autonomes de manière responsable ?
Les agents autonomes sont pratiques. Ils peuvent envoyer des communications, écrire des fichiers, appeler des API et mettre à jour des systèmes en direct. Lorsqu’un agent produit une action incorrecte, des conséquences réelles s’ensuivent. Mettre en place le framework de responsabilité dès le début est essentiel, et les entreprises qui déploient des agents autonomes en production doivent traiter la gouvernance comme une exigence de premier ordre.
Les entreprises doivent voir ce que font leurs agents, inspecter leur raisonnement à chaque étape, auditer leurs actions et intervenir si nécessaire.
Les entreprises qui déploient des agents autonomes de manière responsable se concentrent sur trois priorités :
- Framework ouvert et auditable : NemoClaw est basé sur la base de code sous licence MIT d’OpenClaw, ce qui signifie que les entreprises possèdent l’intégralité du harnais d’agent. Elles peuvent lire, forker et modifier chaque couche de la création et du déploiement de leurs agents. Cette transparence permet aux équipes de comprendre et de contrôler le système au niveau du code. L’exécution de modèles open source tels que NVIDIA Nemotron en local permet de maintenir les charges de travail sensibles, notamment les dossiers des patients, les documents juridiques, les transactions financières et la recherche propriétaire, au sein du propre environnement de l’organisation, garantissant ainsi que les données de suivi restent sous le contrôle de l’organisation.
- Sécurisation de l’environnement d’exécution : NemoClaw exécute des agents à l’intérieur d’OpenShell, un environnement sandbox qui définit précisément ce que l’agent peut et ne peut pas faire, appliquant des limites d’autorisation claires dès le début.
- Calcul local : les supercalculateurs NVIDIA DGX Spark fournissent des performances GPU de niveau Data Center dans une configuration de bureau conçue pour une inférence locale continue toujours activée, avec un hébergement local de modèles et des données restant dans l’environnement de l’entreprise. Les systèmes Station NVIDIA DGX offrent cette capacité aux équipes exécutant plusieurs agents simultanément pour des charges de travail complexes et soutenues.
Les entreprises qui définissent le rôle des agents autonomes en pratique accumulent quelque chose de précieux : des mois d’apprentissage opérationnel en direct, des frameworks de gouvernance développés grâce à des charges de travail réelles et des agents qui ont absorbé le contexte institutionnel qui les rend véritablement utiles. Cette fondation ne fera que s’approfondir au fil du temps.
Démarrez avec NVIDIA NemoClaw
Accédez à un tutoriel étape par étape sur la façon de créer un agent d’IA plus sécurisé avec NemoClaw sur NVIDIA DGX Spark. Découvrez comment NemoClaw peut déployer des assistants d’IA plus sécurisés et toujours actifs avec une seule commande.
Expérimentez NemoClaw, disponible sur GitHub, et rejoignez la communauté des développeurs sur Discord qui créent avec NemoClaw à l’aide de NVIDIA Nemotron 3 Super et Telegram sur DGX Spark.
Informez-vous sur l’IA agentique, NVIDIA Nemotron et sur d’autres sujets en vous abonnant à l’actualité de NVIDIA AI, en rejoignant la communauté et en suivant NVIDIA AI sur LinkedIn, Instagram, X et Facebook.
Découvrez des tutoriels vidéo à suivre à votre rythme et des livestreams.
