Quand les outils d’IA étiquettent mal les modèles et gonflent les factures

Un outil gratuit qui génère des parcours d’apprentissage personnalisés en PDF a engendré une facture de 31 $ sur AWS, malgré seulement 14 visites. Le responsable n’était ni l’application ni ses utilisateurs, mais un agent IA qui a passé un week-end férié à rejouer sans cesse un contexte mis en cache.
L’écart entre les visites et les coûts
Clew Directive, une application web sans état qui produit des PDF succincts après un court questionnaire, a enregistré 14 visites en un mois via Umami. Pourtant, AWS a facturé 31 $, soit environ 2,21 $ par visite – un tarif improbable pour un outil utilisant Amazon Nova, un modèle économique. Les chiffres ne correspondaient pas : l’application ne stocke pas les données des utilisateurs ni n’exécute de modèles coûteux comme Sonnet.
L’agent qui n’aurait pas dû être là
L’utilisation d’Amazon Q et l’analyse du code ont confirmé que l’application en elle-même n’y était pour rien. La politique IAM autorisait uniquement les modèles Nova, et le dépôt contenait Nova Lite et Nova Micro. Quelque chose d’autre appelait les modèles, laissant une trace évidente : 28 millions de tokens traités en seulement huit jours, dont deux jours représentaient 70 % des coûts. Le schéma – écritures en cache massives, lectures colossales et entrées/sorties minimales – pointait vers un agent chargeant et relisant sans cesse un contexte fixe volumineux.
Ce qui s’est réellement passé
Le développeur a retracé ce pic à un projet personnel exécuté pendant le week-end du Memorial Day. Ce code sans lien avait mis en cache une grande requête et continuait à la réutiliser, déclenchant des appels à Nova que la facture AWS attribuait à Clew Directive. Cet incident met en lumière un risque croissant : lorsque les agents IA opèrent en dehors de l’application prévue, les coûts cloud peuvent s’envoler même avec un trafic utilisateur minimal.
Source : DEV Community. Synthèse éditoriale assistée par IA — TechnoExpress.

