● Silicon.fr Télécom 📅 22/04/2026 à 19:06

Le datacenter IA, trame idéale pour le premier CPU d'Arm

Data Science 👤 Clément Bohic
🏷️ Tags : llm réseau rte
Illustration
Dans les datacenters IA, les CPU ont toute leur place pour orchestrer la mécanique. Et le besoin va s’accentuer avec l’agentique. Il y a quelques semaines, Arm a contextualisé ainsi le lancement de son premier processeur, pour serveurs. Nommé AGI CPU, il est basé sur l’architecture Neoverse V3. Comme, entre autres, les puces Vera (NVIDIA), Graviton (AWS), Cobalt (Microsoft) et Axion (Google). Arm propose des configurations à 64, 128 et 136 cœurs, dans une enveloppe thermique de 300 W. Il a conçu un serveur de référence (1U, à 1 ou 2 nœuds), décliné en un rack avec refroidissement à air (30U, 36 kW, jusqu’à 8160 cœurs). ASRock et Lenovo en ont aussi à leur catalogue. Comme Supermicro, avec lequel Arm a également conçu un design 42U à refroidissement liquide (200 kW ; jusqu’à 45 696 cœurs). Côté mémoire, la DDR a été préférée à la LPDDR, tant pour des questions de coût que de capacité. Vu les limites de bande passante (6 Go par cœur dans la config à 136 cœurs), Arm n’a pas jugé idéal d’intégrer le multithreading – d’autant plus que l’amélioration du rapport performance par watt n’est pas significative. Pour l’I/O, on est sur du PCIe Gen6 (+ CXL 3), en attendant la prise en charge de NVLink dans une future révision de Neoverse. Lire aussi : VM cloud : AMD reste dans le match du rapport coût-performance SAP intéressé pour HANA Les datacenters en sont arrivés à une densité d’environ 30 millions de cœurs CPU par GW, affirme Arm. L’entreprise estime que pour absorber les workloads agentiques, il en faudrait 4 fois plus. Et pour cause : ces workloads sont asynchrones, ce qui engendre autant de travail de planification et de contrôle des flux. Des tâches qu’on peut déléguer à des CPU, en concentrant les GPU sur la production des tokens. L’opérateur coréen SK Telecom fait partie des clients de l’AGI CPU. Il l’exploite comme nœud de tête, en combinaison avec des NPU de Rebellions, pour faire tourner son modèle de fondation A.X. Arm a aussi rallié Cloudflare et F5 Networks. Ainsi que SAP. Le groupe allemand a déployé HANA sur Graviton chez AWS et cherche à en reproduire les capacités sur d’autres environnements, notamment dans le contexte des offres « souveraines ». La première demande était toutefois venue de Meta, qui compte utiliser l’AGI CPU en association avec ses accélérateurs MTIA. Il a déjà travaillé avec Arm pour adapter diverses briques logicielles, dont PyTorch, vLLM et FBGEMM (Facebook GEneral Matrix Multiplication). Objectif, dans les grandes lignes : tous les watts économisés sur le CPU alimenteront l’inférence. Les néoclouds dans le viseur Ce SoC est une première pour Arm. Qui, jusqu’ici, vendait de l’IP (blocs de propriété intellectuelle) et du CSS (sous-systèmes packageant ces blocs). En livrant des puces, il se donne la possibilité de toucher des acteurs qui n’ont pas les moyens ou l’échelle pour développer les leurs, en tout cas en temps voulu : telcos, néoclouds, fournisseurs réseau… Quant à la perspective de concurrencer ses clients actuels, Arm assure ne pas être inquiet : le marché est suffisamment grand. Il rappelle avoir connu, avec le CSS, une situation similaire qui n'a, au final, pas compromis ses relations contractuelles. Son patron Rene Haas avance aussi, à demi-mot, l'argument de la neutralité... que n'auront peut-être pas les « clients-concurrents » (il évoque les CPU Vera, conçus pour fonctionner avec le GPU Rubin, avec une interface spécifique et un nombre de cœurs optimisé). Arm a des clients engagés pour les deux premières générations de son CPU (2026-2027). Il dit avoir en ligne de mire « plus d'un milliard de dollars de revenus » sur un horizon de 2 ans. La capacité a été sécurisée auprès de TSMC via un partenaire ASIC. La pénurie de mémoire inquiète davantage Rene Haas. Sur l'IP, Arm annonce un taux de royalties de 5 %, pour autant de marge brute. C'est 10 % sur le CSS. Ses puces, clame-t-il, lui permettront de dégager 50 % de marge brute. Elles feront probablement l'objet d'un segment distinct dans le reporting financier. Illustrations © Arm
← Retour