De l'IA générative à l'IA agentique, revenons sur les progrès en IA de l'année écoulée

Note de l’éditeur : Cet article fait partie de la série AI Decoded, qui démystifie l’IA en rendant la technologie plus accessible et présente de nouveaux matériels, logiciels, outils et accélérations pour les utilisateurs de PC GeForce RTX et de stations de travail NVIDIA RTX.

La série AI Decoded au cours de la dernière année a analysé tout ce qui concerne l’IA, de la simplification des complexités des grands modèles de langage (LLM) à la mise en évidence de la puissance des PC et des stations de travail RTX AI.

Récapitulant les dernières avancées de l’IA, cet aperçu met en évidence comment la technologie a changé la manière dont les gens écrivent, jouent, apprennent et se connectent les uns aux autres en ligne.

Les GPU NVIDIA GeForce RTX offrent la puissance d’offrir ces expériences sur les ordinateurs portables, les ordinateurs de bureau et les stations de travail. Ils disposent d’IA Tensor cores spécialisés qui peuvent fournir plus de 1 300 milliards d’opérations par seconde (TOPS) de puissance de traitement pour des performances de pointe dans les jeux, la création, la productivité quotidienne et plus encore. Pour les stations de travail, les GPU NVIDIA RTX offrent plus de 1 400 TOPS, permettant une accélération et une efficacité de l’IA de niveau supérieur.

Débloquer la productivité et la créativité avec des chatbots alimentés par

l’IA AI Decoded plus tôt cette année a exploré ce que sont les LLM, pourquoi ils sont importants et comment les utiliser.

Pour beaucoup, des outils comme ChatGPT ont été leur première introduction à l’IA. Les chatbots alimentés par LLM ont transformé l’informatique des interactions de base régies par des règles en conversations dynamiques. Ils peuvent suggérer des idées de vacances, écrire des e-mails de service client, créer de la poésie originale et même écrire du code pour les utilisateurs.

Présenté en mars, ChatRTX est une application de démonstration qui permet aux utilisateurs de personnaliser un LLM GPT avec leur propre contenu, comme des documents, des notes et des images.

Avec des fonctionnalités comme la génération augmentée par récupération (RAG), NVIDIA TensorRT-LLM et l’accélération RTX, ChatRTX permet aux utilisateurs de rechercher et de poser des questions rapidement sur leurs propres données. Et étant donné que l’application s’exécute localement sur des PC ou des stations de travail RTX, les résultats sont à la fois rapides et privés.

NVIDIA offre la plus large sélection de modèles de fondation pour les enthousiastes et les développeurs, y compris Gemma 2, Mistral et Llama-3. Ces modèles peuvent fonctionner localement sur des GPU NVIDIA GeForce et RTX pour des performances rapides et sécurisées sans avoir à s’appuyer sur des services cloud.

Téléchargez ChatRTX dès aujourd’hui.

Présentation des applications partenaires accélérées par RTX

L’IA est incorporée dans de plus en plus d’applications et de cas d’utilisation, y compris les jeux, les applications de création de contenu, le développement de logiciels et les outils de productivité.

Cette expansion est alimentée par la large sélection d’outils de développement et de communauté accélérés par RTX, les kits de développement logiciel, modèles et frameworks ont rendu plus facile que jamais d’exécuter des modèles localement dans des applications populaires.

AI Decoded a mis en octobre en évidence comment Leo AI de Brave Browser, alimenté par des GPU NVIDIA RTX et la plateforme open source Ollama, permet aux utilisateurs d’exécuter des LLM locaux comme Llama 3 directement sur leurs PC ou stations de travail RTX.

Cette configuration locale offre des performances d’IA rapides et réactives tout en gardant les données des utilisateurs privées, sans compter sur le cloud. Les optimisations de NVIDIA pour des outils comme Ollama offrent des performances accélérées pour des tâches comme résumer des articles, répondre à des questions et extraire des informations, le tout directement dans le navigateur Brave. Les utilisateurs peuvent basculer entre les modèles locaux et cloud, en offrant flexibilité et contrôle sur leur expérience d’IA.

Pour des instructions simples sur la manière d’ajouter une prise en charge de LLM locale par le biais d’Ollama, lisez l’article de Brave. Une fois configuré pour pointer vers Ollama, Leo AI utilisera le LLM hébergé localement pour les invites et les requêtes.

IA agentique — Permettre la résolution de problèmes complexes

L’IA agentique est la prochaine frontière de l’IA, capable d’utiliser un raisonnement sophistiqué et une planification itérative pour résoudre de manière autonome des problèmes complexes en plusieurs étapes.

AI Decoded a exploré comment la communauté de l’IA expérimentait la technologie pour créer des systèmes d’IA plus intelligents et plus capables.

Les applications partenaires comme AnythingLLM montrent comment l’IA va au-delà de la simple réponse aux questions pour améliorer la productivité et la créativité. Les utilisateurs peuvent exploiter l’application pour déployer des agents intégrés capables de gérer des tâches comme la recherche sur le Web ou la planification de réunions.

Exemple d’un utilisateur invoquant un agent d’IA dans AnythingLLM pour compléter une requête de recherche Web.

AnythingLLM permet aux utilisateurs d’interagir avec des documents via des interfaces intuitives, d’automatiser des tâches complexes avec des agents d’IA et d’exécuter des LLM avancés localement. En exploitant la puissance des GPU RTX, il offre des workflows d’IA plus rapides, plus intelligents et plus réactifs, le tout dans une seule application de bureau locale. L’application fonctionne également hors ligne et est rapide et privée, capable d’utiliser des données et des outils locaux généralement inaccessibles avec des solutions basées sur le cloud.

Le Community Hub d’AnythingLLM permet à quiconque d’accéder facilement aux invites système qui peuvent les aider à orienter le comportement des LLM, à découvrir des commandes de coupure qui améliorent la productivité et à développer des compétences d’agent d’IA spécialisées pour des workflows uniques et des outils personnalisés.

En permettant aux utilisateurs d’exécuter des workflows d’IA agentique sur leurs propres systèmes en toute confidentialité, AnythingLLM alimente l’innovation et facilite l’expérimentation avec les dernières technologies.

Plus de 600 applications et jeux Windows exécutent

déjà l’IA localement sur plus de 100 millions de PC et de stations de travail GeForce RTX AI dans le monde entier, offrant des performances rapides, fiables et à faible latence. En savoir plus sur les PC NVIDIA GeForce RTX AI et les stations de travail NVIDIA RTX AI.

Suivez le discours d’ouverture du CES prononcé par le fondateur et PDG de NVIDIA, Jensen Huang, le 6 janvier pour découvrir comment les dernières innovations en matière d’IA alimentent les jeux, la création de contenu et le développement.

L’IA générative transforme les jeux, les vidéoconférences et les expériences interactives de toutes sortes. Donnez un sens à ce qui est nouveau et à ce qui est à venir en vous abonnant à la newsletter AI Decoded.