Coinbase réduit ses coûts IA en adoptant des modèles chinois

Coinbase remplace discrètement son infrastructure IA basée sur des laboratoires occidentaux par des modèles chinois comme GLM 5.2 et Kimi 2.7. Un système de routage automatisé sélectionne désormais le modèle le plus performant et le plus économique pour chaque requête, tandis qu’un cache agressif a fait passer le taux de réponses réussies de 5 % à 60 %. Malgré une hausse de l’usage des jetons, l’entreprise a réduit de moitié ses dépenses en IA.
Dans les coulisses du routage
Un optimiseur interne évalue en permanence le coût, la latence et la précision des modèles avant d’orienter les requêtes. En période de forte demande, ce sont les modèles chinois, moins chers, qui prennent le relais, tandis que les solutions occidentales premium gèrent les tâches complexes de raisonnement. Résultat : un équilibre entre performance et budget, tout en respectant les attentes clients.
Conséquences pour les laboratoires occidentaux
Cette initiative révèle la pression sur les prix des fournisseurs d’IA occidentaux, à mesure que les alternatives open-weight et régionales gagnent en maturité. En démontrant des économies substantielles, Coinbase pourrait inciter d’autres entreprises à accélérer l’évaluation de familles de modèles non traditionnels pour rester compétitives. Ce changement ne marque pas un rejet total des partenaires occidentaux, mais souligne une approche pragmatique de multi-sourcing dans un contexte budgétaire serré.
Source : The Decoder. Synthèse éditoriale assistée par IA — TechnoExpress.

