Moonshot AI lance Kimi K2.7-Code avec des références de codage renforcées
Moonshot AI a lancé Kimi K2.7-Code, un nouveau modèle d’IA axé sur le codage conçu pour gérer des tâches complexes d’ingénierie logicielle. Publié cette semaine, le modèle affiche des améliorations notables par rapport à son prédécesseur, K2.6, avec une progression de 21,8 % sur la référence Kimi Code Bench v2 et de meilleures performances sur plusieurs tests de codage.
Un modèle conçu pour le développement multi-étapes
K2.7-Code est optimisé pour des flux de travail logiciels complexes, incluant la planification, l’édition, l’exécution d’outils et le débogage sur des sessions prolongées. Contrairement aux modèles de conversation polyvalents, il fonctionne comme un système agentique, gérant des tâches longues plutôt que de fournir des réponses rapides. Le modèle est accessible via l’API Kimi et la plateforme K2.7-Code, avec des poids disponibles sur Hugging Face sous une licence MIT modifiée. Les options d’auto-hébergement incluent vLLM, SGLang et KTransformers, bien que sa taille de 595 Go en fasse un déploiement réservé aux serveurs plutôt qu’un modèle local.
Des gains d’efficacité qui s’accumulent
Outre ses performances, Moonshot souligne une réduction de 30 % de l’utilisation des jetons de raisonnement par rapport à K2.6. Comme ces jetons sont facturés comme des jetons de sortie dans la plupart des modèles tarifaires, cela se traduit par des coûts moindres et des temps de réponse plus rapides – un atout majeur pour les flux agentiques impliquant des centaines ou milliers d’étapes. Le modèle prend également en charge une fenêtre contextuelle de 256K jetons, permettant l’analyse de larges bases de code, de journaux et même d’entrées multimodales comme des captures d’écran ou des vidéos.
Ce qui distingue K2.7-Code
Dans les comparaisons de références, K2.7-Code surpasse K2.6 dans toutes les catégories testées, dépassant souvent des concurrents comme GPT-5.5 et Claude Opus 4.8 sur des tâches spécifiques. Par exemple, il domine le MCP Mark Verified, une référence évaluant la précision d’utilisation des outils via le protocole Model Context Protocol. Les cas d’usage incluent la refonte à grande échelle, la revue automatisée de code et l’analyse à long contexte, où le modèle peut traiter code, journaux et documentation en une seule invite. Grâce à un mode de réflexion obligatoire et à des paramètres d’échantillonnage fixes, le modèle garantit une cohérence et une fiabilité accrues en environnement de production.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

