Les agents IA peinent à corriger le code au niveau des lignes

Les agents IA dédiés au codage font la une en automatisant les corrections, mais une étude récente suggère que leurs performances sont surestimées. Selon cette recherche, ces outils excellent à localiser le bon fichier dans une base de code, mais omettent souvent les lignes exactes à modifier. Les résultats proviennent du repère SWE-Explore, qui sépare la recherche de code des tâches de réparation pour révéler un écart crucial dans l’assistance actuelle par IA.
L’importance du contexte dans les corrections automatisées
Le repère SWE-Explore a été conçu pour évaluer comment les agents IA identifient non seulement le bon fichier, mais aussi les lignes précises à modifier. Les résultats montrent que des outils comme Claude Code ou Codex repèrent fiablement les fichiers pertinents, mais peinent à cibler les segments de code spécifiques. Sans ce contexte granulaire, même les corrections les plus exactes peuvent échouer. L’étude met en lumière une limite majeure : la capacité de l’IA à rechercher ne se traduit pas toujours par une réparation efficace.
Conséquences pour les développeurs et les créateurs d’outils
Pour les équipes qui s’appuient sur l’IA pour rationaliser le débogage ou l’implémentation de fonctionnalités, ces résultats soulignent le besoin d’une compréhension contextuelle plus poussée dans les assistants de codage. Le repère suggère que les modèles actuels pourraient nécessiter un entraînement supplémentaire ou des architectures affinées pour améliorer la précision au niveau des lignes. Les développeurs devront peut-être compléter les suggestions de l’IA par une revue manuelle, surtout pour les modifications complexes ou subtiles. La recherche révèle aussi des pistes pour les créateurs d’outils : renforcer leurs systèmes avec des mécanismes de recherche plus précis ou des approches hybrides combinant IA et méthodes traditionnelles de débogage.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

