Nemotron Labs : comment les agents d’IA transforment les documents en veille stratégique en temps réel

L'intelligence documentaire alimentée par l'IA, construite sur les modèles ouverts NVIDIA Nemotron, améliore la recherche scientifique, les workflows financiers et juridiques.
by NVIDIA Writers

Note de l’éditeur : cet article fait partie de la série de blog Nemotron Labs qui explore comment les derniers modèles, ensembles de données et techniques d’entraînement ouverts aident les entreprises à créer des systèmes et des applications d’IA spécialisés sur les plateformes NVIDIA. Chaque article met en avant des moyens concrets d’utiliser une stack ouverte pour créer de la valeur en production, des copilotes de recherche transparents aux agents d’IA évolutifs.

Les entreprises sont aujourd’hui confrontées au défi de découvrir des informations précieuses enfouies dans une grande variété de documents, notamment des rapports, des présentations, des fichiers PDF, des pages Web et des feuilles de calcul.

Souvent, les équipes doivent encore collecter des informations manuellement, en copiant les données dans des feuilles de calcul, en créant des tableaux de bord et en utilisant des outils de recherche ou de reconnaissance optique de caractères (OCR) basés sur des modèles qui laissent fréquemment de côté des détails importants présents dans des contenus multimédias complexes.

Le traitement intelligent des documents est un workflow basé sur l’IA qui lit, comprend et extrait automatiquement des informations à partir de documents. Il interprète les formats complexes de ces documents, notamment les tableaux, les graphiques, les images et le texte, grâce à des agents d’IA et à des techniques telles que la génération augmentée par récupération (RAG) pour transformer le contenu multimodal en informations facilement exploitables par d’autres systèmes multi-agents et par les utilisateurs.

Avec les modèles ouverts NVIDIA Nemotron et les bibliothèques accélérées par GPU, les entreprises peuvent créer des systèmes d’intelligence documentaire basés sur l’IA pour la recherche, les services financiers, les workflows juridiques et bien plus encore.

Ces modèles ouverts, ainsi que les jeux de données et les recettes d’entraînement ont permis d’obtenir d’excellents résultats dans des classements tels que MTEB, MMTEB et ViDoRe V3, des benchmarks destinés à évaluer les modèles de recherche multilingues et multimodaux. Les équipes peuvent sélectionner les modèles les plus performants pour des tâches telles que la recherche d’information et la réponse aux questions.

Comment le traitement des documents optimise la veille stratégique

Les systèmes d’intelligence documentaire capables d’extraire du sens à partir de mises en page complexes, de s’adapter à d’énormes bibliothèques de fichiers et de montrer précisément d’où provient une réponse sont extrêmement utiles dans les environnements à enjeux élevés. Ces systèmes :

  • Comprennent la richesse des contenus documentaires en allant au-delà de la simple extraction de texte, en capturant aussi les informations issues de graphiques, tableaux, figures et pages multilingues, et traitent les documents comme le ferait un humain en reconnaissant leur structure, les relations entre les éléments et le contexte global.
  • Gèrent de vastes volumes de données en constante évolution, en ingérant et en traitant en parallèle d’énormes collections de documents, tout en maintenant les bases de connaissances continuellement à jour.
  • Découvrent exactement ce dont les utilisateurs ont besoin en aidant les agents d’IA à identifier les passages, les tableaux ou les paragraphes les plus pertinents d’une requête afin qu’ils puissent répondre avec précision et exactitude.
  • Affichent les preuves qui étayent les réponses en fournissant des références à des pages ou des graphiques précis afin que les équipes bénéficient de transparence et de capacité d’audit, ce qui est essentiel dans les industries réglementées.

Cela se traduit par le passage d’archives documentaires statiques à des systèmes de connaissances vivants qui alimentent directement la veille stratégique, l’expérience client et les flux opérationnels.

L’intelligence documentaire en action

Les systèmes de traitement intelligent de documents basés sur les modèles RAG Nemotron, Nemotron Parse et le calcul accéléré de NVIDIA sont déjà en train de transformer la façon dont les entreprises de tous les secteurs tirent parti de leurs des documents pour en extraire des insights.

Justt : gestion des rétrofacturations et optimisation des litiges, native en IA

Dans les services financiers, les litiges de paiement génèrent des pertes de revenus importantes et une complexité opérationnelle pour les marchands, notamment parce que les preuves nécessaires à leur traitement se trouvent dans des formats non structurés. Les journaux des transactions, les communications client et les documents de politique sont souvent fragmentés entre les systèmes et difficiles à traiter à grande échelle, ce qui rend la gestion des litiges lente, manuelle et coûteuse.

Justt.ai fournit une plateforme basée sur l’IA qui automatise l’ensemble du cycle de vie des rétrofacturations. La plateforme se connecte directement aux fournisseurs de services de paiement et aux sources de données marchandes pour ingérer les données de transaction, les interactions client et les politiques, puis assemble automatiquement des preuves spécifiques au litige qui correspondent aux exigences des réseaux de cartes et des émetteurs.

La plateforme d’optimisation des litiges propulsée par l’IA et par Nemotron Parse, applique des analyses prédictives pour déterminer quels rétrofacturations contester ou accepter, et comment optimiser chaque réponse afin de maximiser la récupération nette. Des acteurs majeurs de l’hôtellerie, tels que HEI Hotels & Resorts utilisent cette plateforme pour automatiser le traitement des litiges dans leurs établissements, ce qui leur permet de récupérer des revenus tout en préservant la relation avec leurs clients.

En combinant une intelligence centrée sur les documents avec l’automatisation des décisions, les marchands peuvent regagner une part significative des revenus perdus à cause de rétrofacturations injustifiées, tout en réduisant l’effort lié à un examen manuel.

Découvrez comment l’outil de gestion des rétrofacturations de Justt traite automatiquement les données financières pour gérer les litiges des marchands.

Docusign : passage à l’échelle de l’intelligence des accords

Docusign est le leader mondial de la gestion intelligente des accords, et gère des millions de transactions chaque jour pour plus de 1,8 million de clients et plus d’un milliard d’utilisateurs.

Les contrats sont la base de toutes les entreprises, mais les informations essentielles qu’ils contiennent sont souvent dissimulées dans de longues pages de documents. Pour mettre en évidence les informations, Docusign avait besoin d’une extraction haute fidélité des tableaux, du texte et des métadonnées à partir de documents complexes tels que les fichiers PDF afin de permettre aux entreprises de comprendre et d’exploiter plus rapidement obligations, risques et opportunités.

Docusign évalue Nemotron Parse pour améliorer la compréhension des contrats à grande échelle. Fonctionnant sur des GPU NVIDIA, ce modèle combine une IA avancée avec la détection de mise en page et l’OCR. Le système peut interpréter des tableaux complexes et reconstruire des tableaux avec les informations requises. Cela réduit le besoin de corrections manuelles et contribue à garantir que même les contrats les plus complexes sont traités avec la vitesse et la précision attendues par les clients.

Avec cette base, Docusign va transformer les référentiels d’accords en données structurées qui alimentent les workflows de recherche et d’analyse basés sur l’IA, faisant ainsi des accords de véritables actifs métiers qui aident les entreprises et leurs équipes à améliorer leur visibilité, à réduire les risques et à prendre des décisions plus rapidement.

Edison Scientific : recherche à grande échelle dans la littérature scientifique

Kosmos AI Scientist d’Edison Scientific aide les chercheurs à naviguer dans des paysages scientifiques complexes, à synthétiser la littérature scientifique, à identifier des liens et à mettre en évidence des preuves.

Edison avait besoin d’un moyen rapide et précis d’extraire des informations structurées à partir de grands volumes de PDF, notamment des équations, des tableaux et des figures que les méthodes classiques d’analyse de l’information gèrent souvent mal.

En intégrant le modèle NVIDIA Nemotron Parse à son pipeline PaperQA, Edison peut décomposer des documents de recherche, indexer des concepts clés et ancrer des réponses dans des passages spécifiques, afin d’améliorer le débit et la qualité des réponses pour les scientifiques. Cette approche transforme un corpus de recherche en expansion en un moteur de connaissances interactif et interrogable qui accélère la génération d’hypothèses et l’examen de la littérature.

La haute efficacité de Nemotron Parse permet une prestation rentable à grande échelle, permettant à l’équipe d’Edison de débloquer l’ensemble du pipeline multimodal.

Concevoir une application de traitement intelligent de documents avec les technologies NVIDIA

Un pipeline d’intelligence de document robuste et spécifique à un domaine nécessite des technologies capables de gérer l’extraction, l’intégration et le reclassement des données, tout en garantissant la sécurité et la conformité des données avec les réglementations.

  • Extraction : les modèles d’extraction et d’OCR Nemotron ingèrent rapidement des fichiers PDF, du texte, des tableaux, des graphiques et des images multimodaux pour les convertir en contenu structuré et lisible par machine tout en préservant la mise en page et la sémantique.
  • Intégration : les modèles d’intégration Nemotron convertissent les passages, les entités et les éléments visuels en représentations vectorielles optimisées pour la récupération des documents, permettant une recherche sémantiquement précise.
  • Reranking : les modèles de reranking Nemotron évaluent les passages candidats afin de sélectionner le contenu le plus pertinent comme contexte pour les grands modèles de langage (LLM), améliorant ainsi la fiabilité des réponses et réduisant les hallucinations.
  • Analyse syntaxique : les modèles Nemotron Parse déchiffrent la sémantique des documents pour extraire le texte et les tableaux avec une mise à l’échelle spatiale précise et un flux de lecture correct. En surmontant la variabilité de la mise en page, ils transforment les documents non structurés en données exploitables qui améliorent la précision des LLM et des workflows agentiques.

Ces capacités sont présentées sous forme de microservices NIM NVIDIA et de modèles de fondation qui s’exécutent efficacement sur les GPU NVIDIA, permettant aux équipes de passer de la preuve de concept à la production tout en conservant les données sensibles dans l’environnement Cloud ou de Data Center de leur choix.

Les systèmes d’IA les plus efficaces utilisent une combinaison de modèles de pointe et de modèles open source tels que NVIDIA Nemotron, avec un routeur LLM qui analyse chaque tâche et sélectionne automatiquement le modèle qui lui est le mieux adapté. Cette approche maintient des performances élevées tout en gérant les coûts de calcul et en améliorant l’efficacité.

Démarrez avec NVIDIA Nemotron

Accédez à un didacticiel détaillé sur la façon de créer un pipeline de traitement de documents avec des capacités RAG. Découvrez comment Nemotron RAG peut alimenter des agents spécialisés adaptés à différents secteurs.

De plus, expérimentez avec les modèles Nemotron RAG et la bibliothèque ouverte NVIDIA NeMo Retriever, disponibles sur GitHub et Hugging Face, ainsi que Nemotron Parse sur Hugging Face.

Rejoignez la communauté des développeurs qui créent avec le modèle NVIDIA pour la RAG d’entreprise, approuvée par une douzaine de fournisseurs de plateformes de données d’IA de pointe et disponible dès maintenant sur build.nvidia.com, GitHub et le catalogue NGC.

Informez-vous sur l’IA agentique, de NVIDIA Nemotron et bien plus encore en suivant l’actualité de NVIDIA AI, en rejoignant la communauté et en suivant NVIDIA AI sur LinkedIn, Instagram, X et Facebook.

Découvrez des didacticiels vidéo à suivre à votre rythme et des livestreams.