Acier, capteurs et silicium: comment Caterpillar apporte l’IA embarquée sur les chantiers

Au CES, Caterpillar révèle comment elle intègre les technologies de NVIDIA, de NVIDIA Jetson Thor aux modèles vocaux, pour transformer les industries lourdes à travers le monde.
by Madison Huang

Cette semaine, au CES, l’avenir de la technologie était à l’affiche — et n’est pas passé inaperçu. Il était jaune, en acier et pesait six tonnes de muscle fonctionnel. Bien trop gros pour tenir sur scène.

C’est ainsi que Deepu Talla, vice-président de la robotique et de l’IA à l’Edge chez NVIDIA, a fini par partager la scène avec Caterpillar pour ce qui est, en termes de tonnage, la plus grande démonstration du CES cette année. Lors du discours d’ouverture de Caterpillar au salon, la caméra a fait un plan sur le stand du fabricant d’engins de chantier, où une mini-pelle Cat 306 CR était prête pour une démonstration en direct.

Une vidéo en temps réel prise depuis l’intérieur de la cabine a été diffusée sur les écrans du discours, permettant au public de découvrir de près une nouveauté dans le domaine des équipements lourds : l’interaction en langage naturel.

« Hey Cat, comment puis-je commencer ? »

Une voix, générée par un système d’IA fonctionnant directement sur la machine, a répondu d’une voix naturelle, après avoir interprété la requête et accédé aux informations. À l’écran, le bras s’est levé. Le public s’est penché en avant. Pour un instant, le futur n’était pas une diapositive ou une fiche technique. Il était là, devant eux, fait d’acier et de silicium.

Comme l’a dit le PDG Joe Creed, Caterpillar « construit et alimente la couche invisible de la pile technologique moderne du monde ». Chaque appareil dans la salle, ainsi que chaque centre de données derrière l’essor actuel de l’IA, dépendent des minéraux extraits de la terre et d’une infrastructure qui ne dort jamais.

« C’est ce travail que Caterpillar fait à grande échelle partout dans le monde », a déclaré Creed.

Au CES, cette couche invisible s’est projetée sur scène en tandem avec une intelligence artificielle conçue pour aider les opérateurs à travailler plus en sécurité, efficacement et intuitivement.

Les machines Caterpillar sont conçues pour être polyvalentes, quels que soient le climat, le terrain et les exigences du travail. Et la mini-pelleteuse Cat 306 CR, déjà reconnue pour sa précision et ses fonctionnalités d’assistance à l’opérateur, peut être trouvée sur des chantiers de toutes tailles dans le monde entier.

Dans la démo, l’Assistant IA de Cat a été exécuté sur NVIDIA Jetson Thor, une plateforme d’IA à l’Edge conçue pour les inférences en temps réel dans les systèmes industriels et robotiques.

  • NVIDIA Riva gère la parole, utilisant les modèles de parole NVIDIA Nemotron pour des interactions vocales naturelles rapides et précises.
  • Qwen3 4B, servi localement via vLLM, interprète les requêtes et génère des réponses avec une faible latence, sans connexion au cloud nécessaire.
  • La plateforme de données Helios de Caterpillar fournit un contexte fiable sur la machine.

Voici comment la technologie s’est concrétisée au CES :

  • Sécurité et limites (E-Ceiling) : Les opérateurs ont démontré comment utiliser les fonctionnalités d’assistance pour positionner la machine, notamment en limitant l’amplitude de mouvement afin d’éviter les dangers au-dessus ou sous terre. L’interaction vocale accélère cette configuration, par exemple en ajustant les limites du sol au-dessus des installations connues.
  • Contrôle intuitif : Dans les espaces restreints, le Cat 306 offre des options de contrôle importantes. L’IA agit comme un assistant qui aide l’opérateur à localiser des éléments, à comprendre le comportement de la machine et à résoudre des problèmes grâce à un dialogue naturel.
  • Assistance IA dans la cabine : Caterpillar a présenté le potentiel du Cat AI Assistant pour offrir des conseils personnalisés, des alertes axées sur la sécurité ainsi qu’un accès aux documents et aux ressources.

Ensemble, Caterpillar et NVIDIA étudient comment ces éléments de base pourraient s’étendre à des flottes et des chantiers, en utilisant l’IA à l’Edge pour transformer les volumes croissants de données machines en informations opportunes et exploitables.

L’histoire ne se déroule pas que sur le terrain.

Caterpillar pilote des jumeaux numériques d’usine, basés sur les bibliothèques NVIDIA Omniverse et OpenUSD, sur plusieurs sites aux États-Unis. Ces jumeaux numériques lui permettent de fabriquer des produits pour le bâtiment et la construction ainsi que de grandes machines minières.

Les équipes utilisent ces jumeaux numériques pour simuler les changements de ligne, tester des scénarios de planification et optimiser le flux de matériaux avant tout réoutillage physique.
L’essor de l’IA génère également une nouvelle demande en infrastructures physiques : routes, ports, systèmes électriques et les équipements nécessaires à leur construction et à leur entretien.

C’est pourquoi Caterpillar s’engage à consacrer 100 millions de dollars sur cinq ans à la formation et à l’éducation des travailleurs, notamment via un défi mondial d’innovation pour la main-d’œuvre (Global Workforce Innovation) d’un montant de 25 millions de dollars visant à identifier et mettre en œuvre des solutions qui préparent les travailleurs pour la prochaine génération de systèmes industriels basés sur l’intelligence artificielle.

Alors que la peinture jaune de la mini-pelle Cat 306 brillait à l’écran, Creed a quitté le public avec un rappel :

« Si vous retenez une chose aujourd’hui, j’espère que ce sera celle-ci… Caterpillar est toujours l’entreprise qui construit et alimente le monde physique sur lequel vous comptez chaque jour – et maintenant nous rendons plus intelligente la couche invisible de la pile technologique moderne ».

Ce monde devient plus intelligent, grâce à l’IA embarquée conçue pour aider les opérateurs, les techniciens et les gestionnaires de flotte à travailler avec des machines capables d’écouter, d’expliquer et d’aider. Et le bruit émis par ces machines est le son du futur que nous pouvons déjà entendre.

CARACTÉRISTIQUES TECHNIQUES (référence) :

  • NVIDIA Jetson Thor : plateforme d’IA à l’Edge pour des inférences en temps réel sur les systèmes industriels et robotiques
  • NVIDIA Riva : framework d’IA vocale utilisant Parakeet ASR et Magpie TTS
  • Qwen3 4B LLM : grand modèle de langage compact pour le parsing des intentions et la génération de réponses
  • vLLM : Runtime permettant de servir efficacement les inférences LLM à l’Edge
  • Caterpillar Helios : plateforme unifiée de données fournissant un contexte machine fiable
  • NVIDIA Omniverse: bibliothèques et frameworks de jumeaux numériques et de simulation pour les workflows industriels