La puce Jalapeño d'OpenAI divise par deux les coûts de l'IA

La nouvelle puce Jalapeño d'OpenAI n'est pas qu'un simple processeur : c'est une bouée de sauvetage financière. Conçue en collaboration avec Broadcom, ce circuit intégré spécifique (ASIC) sur mesure vise à réduire les coûts croissants liés à l'exécution des grands modèles de langage (LLM), une dépense qui a englouti 8,4 milliards de dollars du budget d'OpenAI l'an dernier. Avec désormais 900 millions d'utilisateurs hebdomadaires, ces coûts opérationnels devraient atteindre 14 milliards de dollars en 2025. En développant du matériel adapté à ses propres modèles, OpenAI cherche à diminuer ses dépenses d'infrastructure et à reprendre le contrôle d'un marché actuellement dominé par des fournisseurs tiers.

Une puce dédiée à l'inférence, pas à l'IA générale

Contrairement aux accélérateurs IA traditionnels, la puce Jalapeño est conçue spécifiquement pour l'inférence des LLM — le traitement en temps réel qui alimente les interactions des utilisateurs avec des modèles comme ChatGPT. OpenAI a fourni l'architecture centrale, tandis que Broadcom s'est chargé de la conception du silicium et de l'intégration des réseaux haute vitesse. Les premiers échantillons fonctionnent déjà sur des charges de travail non publiées, dont un modèle interne GPT-5.3-Codex-Spark, atteignant les niveaux de puissance et d'efficacité ciblés. Richard Ho, responsable du programme matériel chez OpenAI, souligne que cette conception réduit les transferts de données inutiles, rapprochant les performances des limites théoriques.

Intégration verticale : du silicium au logiciel

Il ne s'agit pas seulement de puces plus rapides, mais d'un contrôle total de la pile technologique. La stratégie d'OpenAI s'inspire de l'approche d'Apple en matière de synergie matériel-logiciel, couvrant tout, de la conception des puces aux systèmes de mémoire, en passant par l'ordonnancement réseau et les couches applicatives finales. En alignant son infrastructure sur ses plans internes de modèles, OpenAI optimise l'efficacité à chaque étape. Résultat ? Des coûts de traitement réduits, des produits plus réactifs, et un cycle vertueux de réinvestissement dans les générations futures de matériel.

Briser la barrière du retardataire

Des concurrents comme Google ont passé près d'une décennie à affiner des puces propriétaires, leur offrant une avance précoce dans le matériel IA. Mais l'entrée d'OpenAI dans le silicium personnalisé marque un tournant : l'efficacité prime désormais sur les avantages hérités. Avec la puce Jalapeño, l'entreprise mise sur l'intégration verticale pour devancer des rivaux encore dépendants de solutions tierces. Les enjeux financiers sont colossaux — OpenAI a engagé 1 400 milliards de dollars pour la puissance de calcul sur huit ans — mais le potentiel de redéfinir l'économie de l'IA pourrait être encore plus grand.

Source : AI News. Synthèse éditoriale assistée par IA — TechnoExpress.

La puce Jalapeño d'OpenAI divise par deux les coûts de l'IA

Une puce dédiée à l'inférence, pas à l'IA générale

Intégration verticale : du silicium au logiciel

Briser la barrière du retardataire

La tech essentielle, chaque matin