Sonnet 5 d’Anthropic : un codage plus intelligent et des tarifs réduits

Anthropic a déployé Claude Sonnet 5, présenté comme son modèle intermédiaire le plus performant à ce jour. Conçu pour des tâches autonomes prolongées, il peut planifier, naviguer dans les navigateurs et les terminaux, et s’auto-corriger sur des flux de travail complexes. Disponible dès aujourd’hui en tant que modèle par défaut pour les utilisateurs Free et Pro, Sonnet 5 est également accessible dans les forfaits Max, Team et Enterprise, ainsi que dans les environnements Claude Code et Claude Platform.
Une fiabilité agentique renforcée
Là où les modèles précédents peinaient à maintenir le contexte sur des tâches à étapes multiples, Sonnet 5 met l’accent sur la « fiabilité agentique »—la capacité à rester sur la bonne voie même en cas d’échec d’appels d’outils ou de changements de conditions. Anthropic présente cette amélioration comme une évolution fondamentale plutôt qu’une simple progression de benchmark. En pratique, cela se traduit par moins de pertes de contexte, une auto-correction plus cohérente et un comportement plus stable lors de sessions prolongées dans des outils comme Claude Code ou Cowork.
Des benchmarks plus solides et des tarifs plus doux
Selon les tests publiés de codage agentique, Sonnet 5 surpasse systématiquement son prédécesseur, Sonnet 4.6, dans toutes les catégories. Sur SWE-bench Pro, il atteint 63,2 %, contre 58,1 % pour Sonnet 4.6 et 69,2 % pour le modèle phare Opus 4.8. Les tâches d’utilisation informatique (OSWorld-Verified) affichent 81,2 % pour Sonnet 5 contre 78,5 %, tandis que le Terminal-Bench 2.1 passe à 80,4 % (contre 67,0 %). Sur Humanity’s Last Exam avec outils, Sonnet 5 atteint 57,4 %, presque équivalent aux 57,9 % d’Opus 4.8. Pour les évaluations du travail de connaissances (GDPval-AA v2), il devance légèrement Opus 4.8.
Les tarifs API de Sonnet 5 sont fixés à un tarif d’introduction de 2 $/10 $ par million de tokens (entrée/sortie) jusqu’au 31 août, puis passeront à 3 $/15 $. Opus 4.8 reste à 5 $/25 $. Pour des tâches peu ou moyennement complexes, Sonnet 5 offre le meilleur rapport qualité-prix, mais à un niveau d’effort très élevé, sa consommation de tokens peut le rendre plus cher qu’Opus 4.8 pour une qualité similaire.
Ajustements du tokeniseur et compromis
Sonnet 5 adopte le tokeniseur mis à jour introduit avec Opus 4.7, qui transforme un même texte en environ 1,0 à 1,35 fois plus de tokens. Cela augmente le nombre de tokens par tâche et donc les coûts si le niveau d’effort est élevé. Anthropic souligne également que les capacités cyber de Sonnet 5 sont délibérément limitées pour des raisons de sécurité, réservant Opus 4.8 aux travaux exigeant une précision maximale.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

