À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative Le peuple réclame les PetaFLOPS !!! Sébastien Gavois Le 25 juin à 15h31 OpenAI présente sa première puce dédiée à l’inférence, développée avec Broadcom. L’entreprise affirme que les premiers tests se passent bien, mais ne donne aucun chiffre précis sur les performances, la consommation, etc. La photo d’un wafer permet de se lancer dans quelques analyses.

Une erreur ? En octobre, nous apprenions qu’OpenAI et Broadcom travaillaient main dans la main pour développer des puces dédiées à l’intelligence artificielle. Contrairement aux GPU généralistes, il est ici question d’ASIC spécialisées.

Économie OpenAI mange à tous les râteliers : après AMD et NVIDIA, c’est au tour de Broadcom Économie Mardi 14 octobre 2025 à 08h30 14/10/2025 08h30 18 Des algos à la puce, OpenAI passe en mode « full stack » Ce n’est pas la première société à venir jouer sur les plates-bandes de NVIDIA. Google est déjà à sa huitième génération de TPU, Amazon et Microsoft sont aussi sur les rangs. C’est donc au tour d’OpenAI de se lancer.

L’entreprise connait bien le sujet des IA génératives et de leurs besoins en calculs puisqu’elle était la première à se lancer avec ChatGPT (désormais en version 5.5). Elle s’appuie sur la connaissance des LLM et de leurs besoins (passés, actuels et à venir) pour développer les fonctionnalités matérielles nécessaires. OpenAI se présente ainsi comme « full stack ».

Sur la partie matérielle, le responsable d’OpenAI (Richard Ho) est un ancien de Google qui a passé plus de huit ans sur les TPU, il connait donc bien le sujet. Pour OpenAI, l’enjeu est double : se détacher de NVIDIA et de ses GPU, mais aussi avoir des puces plus spécialisées et optimisées afin de réduire la consommation (et donc le coût énergétique). Hardware #Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA Hardware Vendredi 12 juin 2026 à 09h39 12/06/2026 09h39 26 OpenAI affirme que sa « première génération d’accélérateurs offrira des performances par watt nettement supérieures à celles des accélérateurs de pointe actuels ».

Sa puce a été « conçue dès le départ pour répondre aux besoins actuels et futurs des LLM », ceux d’OpenAI mais aussi les autres. Attention, cela ne veut pas dire que tout le monde pourra en profiter ; selon Reuters, les puces d’OpenAI seraient utilisées uniquement par OpenAI. Est-ce que ce sera une exclusivité totale, ou bien des puces seront-elles mises à disposition dans ses datacenters (comme le fait Google avec ses TPU) ?

À voir… OpenAI affirme que de premiers échantillons (samples) de Jalapeño « exécutent des charges de travail en machine learning en laboratoire à la fréquence et à la puissance prévues pendant la phase de production, y compris GPT‑5.3‑Codex‑Spark ». Aucun détail toutefois sur les performances ni sur les caractéristiques techniques.

On ne parle pour le moment que d’inférence, c’est-à-dire quand le modèle répond ; pas de la phase d’entrainement qui précède. Caractéristiques techniques et performances ? Circulez, il n’y a rien à voir…

Il faut se contenter de promesses floues : « Bien qu’OpenAI mesure encore la performance finale, les premiers tests montrent que Jalapeño offrira des performances par watt nettement supérieures à l’état de l’art actuel ». Un rapport technique sera publié dans les prochains mois. Hock Tan, président et CEO (équivalent de PDG) de Broadcom affirme qu’en « co-développant directement avec OpenAI notre puce de pointe, nous permettons le déploiement de centres de données à l’échelle du GW avec Microsoft et d’autres partenaires dès 2026 ».

Niveau partenariat, OpenAI cite également Broadcom sur la partie réseau avec son Tomahawk, dont la version 6 (102,4 Tb/s de bande passante totale) peut atteindre 1,6 Tb/s en Ethernet, 128 x 800 GbE, 256 x 400 GbE ou 512 x 200 GbE. C’est le double de la version 5, mais toujours sans savoir quelle version est utilisée. Celestica est aussi cité comme partenaire, afin de « contribuer à l’industrialisation de la plateforme grâce à l’intégration de puces, de cartes, de baies, de réseaux haute performance et de systèmes de production évolutifs », précise OpenAI.

Maintenant que les présentations officielles sont faites, passons à la partie technique. Peu de données sont indiquées, mais la photo du wafer et de la puce d’OpenAI permet de se lancer dans quelques déductions et prospections. Ce que nous apprend la photo officielle du wafer Soutenez un journalisme indépendant, libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles Profitez d'un média expert et unique Intégrez la communauté et prenez part aux débats Partagez des articles premium à vos contacts Abonnez-vous La suite de cet article est réservée à nos abonnés Soutenez un journalisme indépendant, expert et sans pub. Abonnez-vous sur next.ink/subs Aqua Premium Il y a 14 minutes Voir les réponses Message 1 Aller au commentaire enfant Signaler Bloquer cet utilisateur 2 marques de bons goût, à la réputation exemplaire toutes les deux, qui auront certainement une encore meilleure réputation à l'avenir./s (obviously) graveen Premium À l'instant En réponse à Message 1.1 Signaler Bloquer cet utilisateur Rien à ajouter Signaler un commentaire Voulez-vous vraiment signaler ce commentaire ? Non Oui