Intelligence artificielle14 juin 2026· via The Decoder

Une IA compte les objets dans les images avec des consignes textuelles – une avancée majeu

Une IA compte les objets dans les images avec des consignes textuelles – une avancée majeu

Image : The Decoder

Publicité

Compter les objets dans une image semble simple… jusqu’à ce qu’on essaie de l’automatiser. Un nouveau modèle d'IA appelé Count Anything relève ce défi avec une promesse : des comptages précis dans des scènes variées, des échantillons cellulaires microscopiques aux places publiques bondées, le tout à partir d’une simple description textuelle.

Au-delà de la détection basique

Les systèmes d'IA précédents peinaient face à des densités d'objets variables et des formes superposées. Count Anything, en revanche, introduit une méthode qui interprète des consignes en langage naturel pour identifier et dénombrer les éléments — sans nécessiter de jeux de données étiquetés pour chaque scénario. Lors de tests comparatifs, il a réduit les erreurs de comptage de moitié par rapport aux approches antérieures, marquant une avancée significative en précision de vision par ordinateur.

Pas parfait, mais prometteur

Malgré ses progrès, Count Anything n’est pas infaillible. Le modèle bute encore lorsque les objets sont extrêmement denses ou lorsque les termes de la consigne prêtent à interprétation. Par exemple, distinguer chaque grain dans un tas compact reste un obstacle. Pourtant, sa capacité à se généraliser à différents domaines — de la biologie à l’urbanisme — révèle un potentiel bien plus large, notamment là où le comptage manuel serait irréalisable ou impossible.

À mesure que des outils comme celui-ci évoluent, leurs implications dépassent le simple dénombrement. Ils pourraient fluidifier les flux de travail de recherche, optimiser la gestion des ressources, voire assister le suivi environnemental. La route reste à parcourir pour affiner la précision et élargir la compatibilité avec des consignes plus complexes — des défis que l’équipe derrière Count Anything aborde déjà.


Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

Lire la source originale sur The Decoder →

← Retour à l'accueil

Publicité