LlamaIndex révolutionne la recherche de documents juridiques avec des outils agents

LlamaIndex vient de publier en open source legal-kb, une application web de référence qui transforme des dépôts de documents juridiques en bases de connaissances interactives exploitées par un agent IA capable de « parcourir » les fichiers avec des outils familiers du système de fichiers. Au lieu d'effectuer une recherche par plongement unique par requête, l'agent peut lister les documents, analyser leur contenu et extraire des passages précis — un comportement que l'équipe appelle un « outil de récupération ». Construit sur LlamaIndex Index v2 et la plateforme LlamaParse, cette démo illustre comment des opérations de fichiers classiques peuvent alimenter des pipelines de récupération robustes et évolutifs.
Un outil de récupération plus proche du terminal que de la recherche vectorielle
Le outil de récupération bouleverse la récupération traditionnelle en une seule étape. Il expose quatre outils reflétant des actions courantes en ligne de commande : recherche sémantique et par mots-clés (rechercher), découverte de fichiers (trouverFichiers), extraction de texte brut (lireFichier) et appariement de motifs (grepFichier). Chaque outil s'appuie sur les API de récupération d'Index v2, permettant à l'agent d'enchaîner les opérations — localiser d'abord les fichiers, récupérer ensuite des fragments, puis lire ou filtrer les formulations exactes — avant de citer ses sources. L'agent est programmé pour suivre cet ordre, garantissant des réponses traçables.
Du téléchargement à la réponse en temps réel
Le téléchargement d'un document déclenche un pipeline en arrière-plan : les fichiers sont poussés vers LlamaCloud, les métadonnées stockées dans PostgreSQL, et une synchronisation de l'index démarre automatiquement. L'interface interroge régulièrement l'état de l'index jusqu'à sa disponibilité, tandis que la gestion des versions conserve chaque réimport comme une nouvelle version parallèle du même fichier. Lors de la conversation, l'agent interroge l'index actif en utilisant les modèles OpenAI ou Anthropic, avec un raisonnement en flux continu et des citations associées. L'ensemble du processus — du téléchargement à la citation finale — s'effectue sans quitter l'application TanStack Start basée sur navigateur.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

