Claude Fable 5 surpasse GPT-5.5 en mathématiques complexes

Un nouveau test révèle qu’Anthropic’s Claude Fable 5 devance GPT-5.5 d’OpenAI de 13 points sur les problèmes les plus difficiles de FrontierMath. Le modèle atteint ainsi 88 % de précision sur cette catégorie, contre moins de 10 % pour son prédécesseur au début de l’année.
Les clés de cette progression en mathématiques
FrontierMath évalue le raisonnement avancé, et ces derniers résultats montrent une amélioration rapide des systèmes face aux maths complexes. La progression d’Anthropic — passant d’un score à un seul chiffre avec Opus 4.5 à une performance quasi parfaite avec Fable 5 — illustre comment un entraînement ciblé et une augmentation de la taille des modèles peuvent générer des gains rapides dans des domaines spécialisés.
Implications pour la course à l’IA
Bien que GPT-5.5 d’OpenAI reste en tête sur d’autres benchmarks, ce duel met en lumière l’absence de domination absolue d’un modèle sur toutes les tâches. Il suggère aussi que la prochaine vague d’avancées reposera davantage sur des ajustements spécifiques par domaine que sur une généralisation à grande échelle.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

