L'outil qui révèle les connaissances cachées des IA sur les personnes

Un nouveau site web baptisé In the Weights offre un aperçu rare de la façon dont les modèles d’IA stockent et récupèrent des informations sur des personnes. Développé par deux anciens employés d’OpenAI, l’outil estime à quel point une personne donnée est « ancrée » dans les données d’entraînement d’une IA, sans nécessiter de requête directe de l’utilisateur.
La plateforme attribue un « score de profondeur » aux noms saisis par les visiteurs, indiquant dans quelle mesure des figures célèbres comme Mozart, Shakespeare ou Taylor Swift sont présentes dans les corpus d’entraînement sous-jacents. Bien que la méthodologie exacte reste secrète, l’outil propose une façon concrète d’évaluer jusqu’où des personnalités publiques ou privées sont intégrées dans les modèles d’IA.
Fonctionnement de l’interface : les coulisses
In the Weights analyse les associations implicites qu’un modèle d’IA a formées durant son entraînement. Plus le score est élevé, plus le modèle a rencontré fréquemment — et en détail — le nom d’une personne, ses œuvres ou des éléments biographiques. Cette approche contourne l’emploi de requêtes explicites en exploitant les connaissances latentes du modèle pour en déduire sa familiarité.
Les créateurs du site soulignent que leur objectif est de promouvoir la transparence. En rendant ces liens invisibles visibles, ils cherchent à mettre en lumière le caractère souvent opaque des processus d’entraînement des IA. L’outil invite également les utilisateurs à réfléchir aux enjeux de confidentialité, surtout à mesure que les systèmes d’IA deviennent capables de mémoriser des individus spécifiques sans contexte.
Au-delà des célébrités : une réflexion plus large
Bien que l’outil se concentre actuellement sur des figures connues, ses implications concernent aussi les personnes moins médiatisées dont les données pourraient être intégrées dans les ensembles d’entraînement. À mesure que les modèles d’IA ingèrent des quantités toujours plus vastes d’informations publiques, les questions de consentement, de représentation et d’utilisation des données restent sans réponse. In the Weights rappelle que les connaissances de ces systèmes ne sont pas abstraites : elles reposent sur des sources réelles et traçables.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

