OpenAI dévoile Jalapeño, son processeur d'IA révolutionnaire

D'après OpenAI (24 juin 2026 à 08h00)

Résumé

OpenAI et Broadcom lancent Jalapeño, un processeur d’inférence IA conçu de zéro pour les LLM, promettant une performance par watt largement supérieure et un déploiement à l’échelle du gigawatt.

Les faits

OpenAI et Broadcom ont dévoilé Jalapeño, présenté comme le premier « Intelligence Processor » d’OpenAI et le premier accélérateur IA d’une plateforme de calcul multi‑générationnelle visant à rendre l’IA avancée plus rapide, plus fiable et plus accessible à un plus grand nombre de personnes. Le composant a été conçu de zéro par OpenAI autour d’une vision centrée sur l’inférence des grands modèles de langage, en s’appuyant sur sa compréhension des fondamentaux des LLM, de sa feuille de route de modèles, de kernels, de systèmes de serving et de besoins produits. Broadcom et Celestica contribuent à industrialiser la plateforme via l’implémentation du chip, l’intégration cartes et racks, le réseau hautes performances et des systèmes de production évolutifs. Des échantillons de Jalapeño exécutent déjà des charges de travail de machine learning en laboratoire à la fréquence et à la puissance cibles de production, incluant le modèle GPT‑5.3‑Codex‑Spark. Selon les premiers tests, ce premier accélérateur offrirait une performance par watt « substantiellement meilleure » que l’état de l’art actuel, grâce à une architecture qui réduit les mouvements de données et équilibre calcul, mémoire et réseau pour rapprocher l’utilisation réalisée du pic théorique. Le programme Jalapeño a été co‑développé de la conception au tape‑out de fabrication en neuf mois, ce que OpenAI présente comme le cycle de développement ASIC le plus rapide jamais atteint dans les semi‑conducteurs haute performance. Cette cadence est attribuée au co‑développement étroit logiciel‑matériel avec les équipes d’ingénierie d’OpenAI, à l’expertise d’implémentation silicon de Broadcom et à l’usage des modèles d’OpenAI pour accélérer certaines étapes.

Pourquoi c’est important

Jalapeño s’inscrit au cœur de la stratégie de « full stack » d’OpenAI, qui ne se limite plus aux modèles et aux produits, mais englobe désormais l’architecture des puces, les kernels, les systèmes mémoire, le réseau, l’ordonnancement, les systèmes de déploiement et l’expérience produit. En contrôlant davantage de couches, l’entreprise explique pouvoir optimiser l’ensemble autour d’un objectif unique : rendre ses modèles plus rapides, plus fiables et plus abordables pour les utilisateurs. OpenAI décrit Jalapeño comme un maillon qui renforce son « flywheel » d’innovation : une meilleure infrastructure améliore l’efficacité de calcul, qui permet un entraînement et un serving plus performants, produisant des modèles plus capables, lesquels alimentent de meilleurs produits, générant plus d’usage, de clients et de revenus. Ce surplus permet de réinvestir dans la prochaine génération d’infrastructure, avec à terme une intelligence plus capable, plus fiable et moins coûteuse pour tous.

Questions fréquentes

Qu’est‑ce que Jalapeño pour OpenAI ?

Jalapeño est le premier « Intelligence Processor » d’OpenAI, un accélérateur IA conçu spécifiquement pour l’inférence de grands modèles de langage.

À quoi sert Jalapeño pour les LLM ?

Le chip est conçu de zéro pour l’inférence des LLM actuels et futurs, avec une architecture optimisée autour des kernels, de la mémoire, du réseau et des schémas de serving.

Quelle performance OpenAI promet‑elle avec Jalapeño ?

Les premiers tests indiquent une performance par watt substantiellement meilleure que l’état de l’art, grâce à une réduction des mouvements de données et à un meilleur équilibre des ressources.

En combien de temps Jalapeño a‑t‑il été développé ?

OpenAI affirme avoir co‑développé Jalapeño du design au tape‑out de fabrication en neuf mois, en s’appuyant notamment sur ses propres modèles d’IA.

Quel rôle jouent Broadcom et Celestica ?

Broadcom apporte l’implémentation silicon et le réseau hautes performances, tandis que Celestica contribue à l’intégration cartes, racks et systèmes de production.

Source

OpenAI

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.