Développement5 juillet 2026· via DEV Community

NodeLLM 1.17 : IA plus intelligente avec MCP et ORM optimisés

NodeLLM 1.17 : IA plus intelligente avec MCP et ORM optimisés

Image : DEV Community

NodeLLM 1.17 bouleverse la relation classique entre modèle et serveur en intégrant l'échantillonnage MCP, permettant aux serveurs de demander des complétions LLM aux clients au lieu de simplement exposer des outils. Cette version introduit également l'exécution parallèle d'outils et une intégration renforcée de l'ORM, éliminant les solutions de contournement nécessaires jusqu'à présent.

Inverser le flux MCP avec l'échantillonnage

Les configurations MCP traditionnelles permettent aux clients de découvrir les outils proposés par les serveurs. NodeLLM 1.17 inverse cette logique. Grâce à l'échantillonnage, les serveurs peuvent désormais demander au client d'effectuer une complétion LLM pour leur compte – pratique pour des tâches comme la synthèse ou la classification sans gérer de clés API séparées. Les développeurs configurent le gestionnaire avec leur modèle préféré, et le serveur n'annonce les outils qu'après avoir vérifié le support de l'échantillonnage lors de l'établissement de la connexion. Pour un contrôle précis, un gestionnaire personnalisé peut traiter les paramètres bruts d'échantillonnage avant de décider comment – ou s'il faut – répondre.

Exécuter plusieurs outils simultanément

Lorsque le modèle retourne plusieurs appels d'outils indépendants en un seul tour, NodeLLM permet désormais de les exécuter en parallèle grâce au paramètre toolConcurrency. Un exemple de recherche météo illustre l'avantage : interroger Tokyo, Londres et New York ne nécessite plus d'attendre chaque appel séquentiellement. Ce paramètre s'applique également aux modes streaming et agentique, garantissant des gains de latence constants dans les flux de travail sans modifier les définitions des outils.

Contrôle cohérent dans les chats basés sur l'ORM

Les utilisateurs d'ORM bénéficient des mêmes paramètres d'exécution autrefois réservés au cœur de NodeLLM. Les chats basés sur Prisma, par exemple, peuvent imposer des flux de confirmation ou d'autres modes sans recourir à des API de bas niveau. Cette uniformité assure un comportement prévisible, que les outils soient gérés en mémoire ou persistés via l'ORM, simplifiant ainsi les systèmes agentiques de longue durée ou d'état.


Source : DEV Community. Synthèse éditoriale assistée par IA — TechnoExpress.

Lire la source originale sur DEV Community →

← Retour à l'accueil