NVIDIA lance ASPIRE pour apprendre aux robots à corriger leurs erreurs
NVIDIA et des partenaires universitaires ont dévoilé ASPIRE, un cadre robotique auto-améliorable qui permet aux agents d’IA de rédiger, déboguer et affiner leurs propres programmes de contrôle sans intervention humaine. Lors de premiers tests sur des tâches longues, le système a atteint un taux de réussite de 31 % en zero-shot sur les références LIBERO-Pro, dépassant les approches traditionnelles basées sur des scripts rigides et manuels.
Des scripts fragiles aux apprenants permanents
La plupart des programmes robotiques sont statiques : une fois déployés, ils n’apprennent jamais de leurs nouvelles erreurs. ASPIRE rompt avec cette logique grâce à un cycle d’apprentissage en boucle fermée, où les robots analysent les traces d’exécution, isolent les défauts et stockent les corrections validées dans une bibliothèque partagée de compétences. Contrairement aux systèmes antérieurs qui rejettent chaque tentative, ASPIRE conserve les connaissances réutilisables — de minuscules extraits de guidage incluant les signatures d’échec, les conditions de déclenchement et les stratégies de réparation — permettant aux tâches ultérieures de profiter des erreurs passées.
Une boucle de débogage et d’exploration
ASPIRE repose sur trois composants principaux : un coordinateur qui gère la bibliothèque de compétences, des agents codeurs qui génèrent les programmes de contrôle, et un moteur d’exécution multimodal qui enregistre les traces par primitive. En cas d’échec, l’agent inspecte uniquement les appels impliqués — tentatives de préhension, plans de mouvement ou invites de perception — localise le défaut, et réexécute pour confirmer la correction avant de l’intégrer à la bibliothèque. Pour éviter de s’enliser dans des boucles de réparation locales, ASPIRE génère également plusieurs programmes candidats à chaque itération, orientant l’exploration vers des stratégies inédites plutôt que vers l’ajustement infini d’une seule approche.
Des compétences transférables, pas seulement répétitives
La véritable innovation d’ASPIRE réside dans sa bibliothèque de compétences compacte et transférable. Au lieu de stocker des programmes complets, elle sauvegarde de petits éléments réutilisables — comme un heuristique d’« approche multi-angles » qui ajuste la pose cible d’un robot pour éviter les collisions avec les bords de table. En distillant les corrections en indications contextuelles, ASPIRE permet aux robots de s’adapter à de nouvelles configurations sans repartir de zéro, se rapprochant ainsi de systèmes qui gagnent en intelligence à chaque essai.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

