Les détecteurs d’IA peinent à distinguer l’écrit humain de celui des machines

Un test récent mené par l’Authors Guild a révélé une divergence surprenante dans la manière dont les outils de détection d’IA traitent les contenus écrits par des humains. Si certains détecteurs identifient avec précision des textes authentiques, d’autres les classent systématiquement comme générés par IA, soulevant de nouvelles inquiétudes quant à la fiabilité de ces systèmes en contexte professionnel.
Des résultats contrastés
L’Authors Guild a évalué cinq outils de détection d’IA sur des textes écrits par des humains. Pangram et Grammarly ont correctement reconnu tous les passages rédigés par des humains, affichant des performances solides. À l’inverse, Sidekick et ZeroGPT ont systématiquement classé chaque article humain comme généré par IA, révélant des incohérences majeures dans le secteur. Ces résultats indiquent que la précision varie considérablement selon l’outil utilisé, compliquant la standardisation des méthodes de détection pour les écrits professionnels.
Le paradoxe du style soigné
Au-delà des résultats mitigés, le test a mis en lumière un problème plus profond : les textes humains édités et polis ressemblent souvent à des productions d’IA, car les modèles linguistiques modernes ont été entraînés sur des contenus de haute qualité, écrits par des professionnels. Cette similitude crée un paradoxe où les textes humains et ceux générés par IA peuvent apparaître statistiquement identiques, rendant la détection précise intrinsèquement complexe. L’Authors Guild met en garde contre une dépendance excessive aux détecteurs d’IA, qui pourrait mener à des accusations infondées de plagiat ou de manipulation, notamment dans les secteurs où le langage soigné est la norme.
Pour les rédacteurs, éditeurs et éditeurs, ce test souligne la nécessité de prudence dans l’utilisation des outils de détection d’IA. Si certains outils montrent des promesses, d’autres risquent de causer plus de tort que de bien en étiquetant à tort des travaux légitimes. Le secteur pourrait avoir besoin de développer des approches plus nuancées – ou du moins des directives plus claires – pour garantir des évaluations équitables et précises de la paternité des textes.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

