« North Mini Code » de Cohere rend le codage assisté par IA efficace sur votre propre matériel
Cohere AI a cette semaine dévoilé North Mini Code, son premier modèle de développement logiciel conçu pour fonctionner de manière efficace sur un seul GPU H100. Ce modèle à poids ouverts de type mélange d'experts (MoE) contient 30 milliards de paramètres au total, mais n'en active que trois milliards à chaque passe avant, équilibrant performance et besoins en ressources.
Un modèle conçu pour des flux de travail autonomes
North Mini Code vise trois tâches principales : la génération de code, l'ingénierie logicielle autonome et les opérations de terminal. Contrairement à ses modèles multimodaux plus larges, il traite uniquement du texte avec une fenêtre de contexte de 256K et une sortie maximale de 64K jetons. Cohere a optimisé l'architecture pour des flux de travail autonomes pouvant appeler des outils, raisonner pas à pas et orchestrer des sous-agents — des fonctionnalités clés pour les pipelines de développement d’IA modernes.
Conception légère, haute productivité
Le modèle utilise une architecture Transformer sans encodage positionnel rotatif, avec des couches MoE clairsemées alternant une attention locale et globale dans un rapport 3:1. Son bloc d'aiguillage compte douze experts, dont huit sont activés par jeton à l'aide d'un routeur sigmoïde. Cette conception maintient un faible nombre de paramètres actifs tout en préservant une large capacité. Dans des tests de performance internes, North Mini Code a délivré un débit jusqu'à 2,8 fois supérieur au modèle de référence sur du matériel identique, ainsi qu'une réduction de 30 % de la latence entre jetons.
Les poids sont publiés sous licence Apache 2.0 sur Hugging Face, avec des accès supplémentaires via l'API Cohere, le Model Vault et OpenRouter. La configuration matérielle minimale est un seul GPU H100 fonctionnant en précision FP8, ce qui rend le déploiement réaliste pour les équipes ne disposant pas de grands clusters. Cohere inscrit cette sortie dans son programme « IA souveraine », mettant l’accent sur le contrôle et l’autonomie pour les développeurs qui préfèrent exécuter des modèles selon leurs propres conditions.
Source : MarkTechPost. Synthèse éditoriale assistée par IA — TechnoExpress.

