Les chèvres dans *Age of Empires II* révèlent les limites de la recherche en IA

Dans une expérience à la fois ludique et provocante, un chercheur de Microsoft a exploité chèvres, ponts et rampes de glace dans Age of Empires II pour questionner la méthode de la recherche en IA. En construisant un réseau de neurones fonctionnel à partir de ces éléments inhabituels, l’étude remet en cause l’hypothèse selon laquelle de nombreuses recherches en IA attribuent trop rapidement des traits humains aux modèles de langage avant même de les tester.
Le chercheur a analysé 315 articles et constaté que plus de la moitié présupposaient déjà des caractéristiques humaines aux modèles avant toute expérimentation. Cela soulève des inquiétudes quant au biais de confirmation dans la recherche en IA, où les idées préconçues influencent les résultats. L’expérience remplace l’interface conversationnelle classique par des chèvres errantes dans un jeu vidéo, tout en conservant les mêmes fondements mathématiques. Pourtant, la différence est frappante : elle révèle à quel point il est facile de projeter des traits humains sur des systèmes non humains.
Repenser le prisme anthropomorphique en IA
La critique met en lumière un problème plus large de la recherche en IA : la tendance à humaniser les modèles avant même de connaître leurs capacités réelles. Les modèles de langage sont souvent décrits comme ayant de la « compréhension » ou des « croyances », des termes qui suggèrent une cognition humaine. L’approche ludique du chercheur de Microsoft montre comment ce biais peut fausser à la fois la perception et l’évaluation des systèmes d’IA.
Bien que l’expérience repose sur l’humour, ses implications sont sérieuses. Si les chercheurs attribuent déjà des traits humains à l’IA avant les tests, cela peut conduire à des conclusions erronées sur les performances et le potentiel des modèles. L’étude suggère qu’une approche plus critique — résistant à l’anthropomorphisme prématuré — pourrait renforcer la rigueur de la recherche en IA.
Pour la communauté de l’IA, le message est clair : avant de supposer que les modèles de langage pensent ou ressentent comme des humains, peut-être faudrait-il d’abord se demander s’ils sont même conçus pour le faire.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

