Datalab dévoile *Lift*, un modèle IA de 9 milliards de paramètres pour extraire du JSON de
Datalab vient de lancer Lift, un modèle vision open source de 9 milliards de paramètres qui convertit PDF et images en JSON propre en une seule passe. Fournissez-lui un schéma JSON standard et le modèle renvoie un objet JSON correspondant sans étape de traitement supplémentaire. C’est le premier modèle conçu spécifiquement pour l’extraction structurée chez Datalab, complétant leur pile OCR open source existante qui inclut déjà Chandra, Marker et Surya.
Extraction en une passe pour les documents multi-pages
Lift traite l’ensemble des documents d’un coup, même lorsque les valeurs s’étendent sur plusieurs pages. Plus besoin de découper, d’OCRiser et de reassembler : chaque page est analysée en une seule inférence. Le modèle affiche une médiane de 9,5 secondes par document sur le banc d’essai de Datalab et atteint une précision de 90,2 % sur 225 documents testés, se classant ainsi en tête des modèles d’extraction auto-hébergés de petite taille évalués par l’équipe.
Décodage contraint par schéma pour un JSON valide
Le secret réside dans le décodage contraint par schéma : Lift compile le schéma JSON fourni en une grammaire que le serveur vLLM applique token par token pendant la génération. Seuls les tokens conformes au schéma restent dans le pool d’échantillonnage, garantissant que la sortie correspond à la structure requise sans post-traitement. Les types supportés incluent chaînes de caractères, nombres, booléens, objets imbriqués et tableaux. Les champs scalaires peuvent aussi s’abstenir en émettant null, offrant au modèle un moyen élégant de sauter les valeurs incertaines sans altérer la structure JSON. Si le schéma contient des constructions non compilables — énumérations, oneOf/anyOf, $refs ou additionalProperties — le système enregistre un avertissement et poursuit sans contraintes, maintenant le pipeline opérationnel tout en sacrifiant la garantie structurelle pour cette exécution.
Deux modes d’exécution, code sous licence Apache 2.0
Le package propose à la fois une inférence locale via Hugging Face et une inférence distante via un serveur vLLM, cette dernière étant recommandée pour la production. Le code est publié sous licence Apache 2.0, tandis que les poids du modèle utilisent une licence OpenRAIL-M modifiée, en phase avec l’approche open de l’écosystème Datalab. Lift s’inscrit dans une niche croissante de modèles d’extraction open source, aux côtés d’outils spécialisés comme NuExtract et de modèles vision-langage généraux tels que Qwen3.5-9B.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

