Le nouveau modèle léger de Liquid AI révolutionne l'IA locale

Liquid AI vient de publier LFM2.5-230M, un modèle de 230 millions de paramètres conçu pour une seule mission : exécuter des tâches agentiques comme l'extraction de données et l'utilisation d'outils sur smartphones, robots et autres périphériques en bordure de réseau. Disponible sous forme de points de contrôle à poids ouverts sur Hugging Face, ce modèle privilégie l'efficacité brute plutôt qu'une polyvalence généraliste, atteignant 213 tokens par seconde sur un Galaxy S25 Ultra et 42 tokens par seconde sur un Raspberry Pi 5. Il surpasse des rivaux plus imposants comme Qwen3.5-0.8B et Gemma 3 1B en suivi d'instructions et extraction de données, tout en occupant seulement 293 à 375 Mo.

Une architecture conçue pour les périphériques légers

LFM2.5-230M est le modèle le plus compact de la gamme Liquid AI, doté d'une architecture hybride combinant huit blocs de convolution LIV à double porte et six couches d'attention à requêtes groupées. Cette structure optimise l'inférence sur CPU, essentielle pour les appareils aux ressources limitées. Le modèle prend en charge une fenêtre de contexte de 32 768 tokens et un vocabulaire de 65 536 tokens, couvrant dix langues dont l'anglais, le chinois, l'arabe et le japonais. Sa base de connaissances est actualisée jusqu'à mi-2024 et il est proposé en deux versions : un modèle de base pour l'affinage et une variante adaptée aux instructions pour un usage général.

Un entraînement axé sur la précision

Liquid AI a pré-entraîné ce modèle sur 19 000 milliards de tokens, incluant une phase d'extension de la fenêtre de contexte à 32K. L'affinage ultérieur a suivi une méthode en trois étapes : un affinage supervisé avec distillation à partir du modèle plus grand LFM2.5-350M, une optimisation directe des préférences et un apprentissage par renforcement multi-domaines. L'étape de distillation est cruciale : elle permet au modèle de 230 millions de paramètres de reproduire le comportement de son homologue plus volumineux sur des tâches ciblées, sans surcharge. Les résultats des bancs d'essai confirment cette approche : LFM2.5-230M excelle en suivi d'instructions et extraction de données, mais peine sur des tâches de connaissances générales comme MMLU-Pro, où il obtient un score de 20,25 contre 37,42 pour Qwen3.5-0.8B.

Une puissance pratique, sans dépendance au cloud

Les atouts concrets du modèle se révèlent dans les pipelines nécessitant un traitement local. Une version quantifiée sur 4 bits tient dans seulement 293 à 375 Mo de mémoire, permettant par exemple de structurer 100 000 rapports cliniques sans transmettre les données vers le cloud. Liquid AI annonce une prise en charge immédiate par les frameworks d'inférence populaires — llama.cpp, MLX, vLLM, SGLang et ONNX —, facilitant son intégration par les développeurs travaillant sur des outils d'automatisation ou des systèmes embarqués. Le compromis est clair : si vos besoins portent sur les mathématiques, la génération de code ou l'écriture créative, ce modèle n'est pas adapté. En revanche, pour des tâches natives de bordure comme l'extraction de données et l'utilisation d'outils, LFM2.5-230M se distingue là où les autres échouent.

Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

Le nouveau modèle léger de Liquid AI révolutionne l'IA locale

Une architecture conçue pour les périphériques légers

Un entraînement axé sur la précision

Une puissance pratique, sans dépendance au cloud

La tech essentielle, chaque matin