NVIDIA annonce le Vera Rubin POD équipé de 1 152 GPU répartis sur 40 racks, offrant 60 exaflops et des performances d'inférence 10 fois supérieures par watt par rapport à Blackwell. (ReadNVIDIA annonce le Vera Rubin POD équipé de 1 152 GPU répartis sur 40 racks, offrant 60 exaflops et des performances d'inférence 10 fois supérieures par watt par rapport à Blackwell. (Read

NVIDIA dévoile le supercalculateur IA Vera Rubin POD de 40 racks pour les charges de travail agentiques

2026/03/17 03:48
Temps de lecture : 4 min
Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : [email protected]

NVIDIA dévoile le superordinateur IA Vera Rubin POD à 40 racks pour les charges de travail agentiques

Iris Coleman 16 mars 2026 19h48

NVIDIA annonce le Vera Rubin POD équipé de 1 152 GPU sur 40 racks, offrant 60 exaflops et une performance d'inférence 10 fois supérieure par watt par rapport à Blackwell.

NVIDIA dévoile le superordinateur IA Vera Rubin POD à 40 racks pour les charges de travail agentiques

NVIDIA vient de dévoiler les spécifications de son projet d'infrastructure IA le plus ambitieux à ce jour. Le Vera Rubin POD intègre 1 152 GPU Rubin sur 40 racks, offrant 60 exaflops de puissance de calcul et 10 pétaoctets par seconde de bande passante totale de montée en charge. Les unités de production seront livrées au second semestre 2026.

Les chiffres sont impressionnants : 1,2 quadrillion de transistors, près de 20 000 puces NVIDIA, toutes conçues pour fonctionner comme un seul superordinateur cohérent. NVIDIA revendique une performance d'entraînement 4 fois supérieure et une performance d'inférence 10 fois supérieure par watt par rapport à son architecture Blackwell actuelle, avec des coûts de token réduits à un dixième des niveaux actuels.

Cinq systèmes de racks spécialement conçus

Le POD combine cinq systèmes distincts à l'échelle du rack, chacun ciblant des goulets d'étranglement spécifiques dans les charges de travail IA modernes :

Vera Rubin NVL72 sert de moteur de calcul principal. Chaque rack intègre 72 GPU Rubin et 36 CPU Vera connectés via NVLink 6, qui fournit 3,6 To/s de bande passante par GPU, soit plus de bande passante totale que l'ensemble de l'internet mondial, selon NVIDIA. Le système cible les quatre lois de mise à l'échelle de l'IA : pré-entraînement, post-entraînement, mise à l'échelle au moment du test et mise à l'échelle agentique.

Les racks Groq 3 LPX s'attaquent au problème de latence. Avec 256 unités de traitement du langage par rack utilisant une architecture uniquement SRAM, ceux-ci s'associent au NVL72 pour offrir ce que NVIDIA affirme être 35 fois plus de tokens et 10 fois plus d'opportunités de revenus pour les modèles à mille milliards de paramètres par rapport à Blackwell.

Les racks CPU Vera fournissent des environnements sandbox pour les tests d'Agents d'IA. Un seul rack maintient plus de 22 500 environnements d'apprentissage par renforcement simultanés, essentiels pour valider les sorties d'IA agentique avant le déploiement.

Les racks BlueField-4 STX introduisent ce que NVIDIA appelle le « stockage natif IA » via la plateforme de mémoire contextuelle CMX. En déchargeant le cache KV vers un Stockage hors ligne dédié à haute bande passante, le système revendique 5 fois plus de tokens par seconde et une efficacité énergétique 5 fois supérieure aux approches traditionnelles.

Les racks réseau Spectrum-6 SPX relient le tout avec des commutateurs 102,4 Tb/s dotés d'optiques co-packagées.

L'argument économique des tokens

NVIDIA présente cela autour d'une réalité de marché spécifique : la consommation de tokens dépasse maintenant 10 quadrillions par an, et le passage des interactions humain-IA aux interactions IA-IA accélérera considérablement cette croissance. Les systèmes agentiques modernes génèrent des volumes massifs de tokens de raisonnement tout en augmentant les exigences de cache KV, exactement le goulet d'étranglement que cette architecture cible.

Les benchmarks InferenceMax de SemiAnalysis tiers cités par NVIDIA montrent que les systèmes Blackwell actuels offrent déjà une performance 50 fois supérieure par watt et un coût par token 35 fois inférieur par rapport au H200. Vera Rubin vise à étendre cette avance.

Ingénierie thermique et énergétique

L'architecture de rack MGX de troisième génération introduit le lissage de puissance intelligent avec 6 fois plus de stockage d'énergie au niveau du rack (400 joules par GPU) que les générations précédentes. Cela réduit les demandes de courant de crête jusqu'à 25 % et élimine le besoin de packs de batteries massifs.

Tous les racks fonctionnent à des températures d'admission d'eau chaude de 45°C, permettant aux centres de données dans de nombreux climats d'utiliser le refroidissement par air ambiant. NVIDIA affirme que cela libère suffisamment d'énergie pour ajouter 10 % de racks supplémentaires dans le même budget énergétique de l'installation.

Perspectives d'avenir

Au-delà de la configuration POD initiale, NVIDIA a présenté le Vera Rubin Ultra NVL576 s'étendant à 576 GPU sur huit racks, et l'architecture Kyber de nouvelle génération ciblant le NVL1152 avec 144 GPU par rack. La feuille de route suggère que NVIDIA voit les domaines NVLink multi-racks comme l'avenir de l'infrastructure IA, pas seulement des GPU plus grands, mais des architectures système fondamentalement différentes.

Pour les entreprises planifiant des investissements en infrastructure IA, le message est clair : l'économie du calcul IA passe de l'optimisation au niveau des puces à l'optimisation au niveau des installations. Ceux qui construisent des centres de données maintenant font face à un choix entre les systèmes de génération actuelle et l'attente de la disponibilité de Vera Rubin fin 2026.

Source de l'image : Shutterstock
  • nvidia
  • infrastructure ia
  • vera rubin
  • centres de données
  • ia d'entreprise
Opportunité de marché
Logo de D. Energy
Cours D. Energy(WATT)
$0.19945
$0.19945$0.19945
-0.26%
USD
Graphique du prix de D. Energy (WATT) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Ce que les licenciements chez Oracle signifient pour l'action ORCL maintenant

Ce que les licenciements chez Oracle signifient pour l'action ORCL maintenant

L'article What Oracle Layoffs Mean for ORCL Stock Now est paru sur BitcoinEthereumNews.com. Oracle est de nouveau au centre de l'attention alors que les licenciements et les dépenses en IA entrent en collision. L'entreprise
Partager
BitcoinEthereumNews2026/04/01 05:53
Le récent rallye de Solana (SOL) peut impressionner, mais les investisseurs visant un ROI qui change la vie regardent ailleurs

Le récent rallye de Solana (SOL) peut impressionner, mais les investisseurs visant un ROI qui change la vie regardent ailleurs

Le post La récente hausse de Solana (SOL) peut impressionner, mais les investisseurs visant un ROI qui change la vie regardent ailleurs est apparu sur BitcoinEthereumNews.com. La dernière hausse de Solana (SOL) a attiré des investisseurs du monde entier, mais l'histoire plus importante pour les investisseurs visionnaires est de savoir où se dirigent les prochaines vagues de rendements qui changent la vie. Alors que Solana continue de connaître des niveaux élevés d'utilisation de l'écosystème et d'utilisation du réseau, la scène se prépare lentement pour Mutuum Finance (MUTM). MUTM est proposé à 0,035 $ dans sa prévente en croissance rapide. Une appréciation de prix de 14,3 % est ce que les investisseurs vont anticiper dans la prochaine phase. Plus de 15,85 millions de dollars ont été levés alors que la prévente continue de prendre de l'ampleur. Contrairement à la majorité des tokens surfant sur des vagues de pre-hype à court terme, Mutuum Finance devient un choix axé sur l'utilité avec un potentiel de valeur plus important et donc une option de plus en plus intéressante pour les investisseurs qui recherchent plus qu'une simple action sur les prix. Solana maintient ses gains près de 234 $ alors que la spéculation persiste Solana (SOL) se négocie actuellement à 234,08 $, maintenant sa fourchette de 24h autour de 234,42 $ à 248,19 $ illustrant la tendance récente. Le token a enregistré de solides gains sur sept jours de près de 13 %, dépassant de loin la plupart de ses pairs, soutenu par un volume croissant et des achats institutionnels. La résistance se situe à 250-260 $, et le support semble être à 220-230 $, ce qui constitue des niveaux significatifs pour une potentielle percée ou un repli. Cependant, la nouvelle crypto DeFi Mutuum Finance est considérée par les observateurs du marché comme ayant un potentiel de hausse plus important, étant encore en prévente. Prévente Phase 6 de Mutuum Finance Mutuum Finance est actuellement en Phase 6 de Prévente et propose des tokens à 0,035 $. La prévente a progressé très rapidement, et les investisseurs ont levé plus de 15,85 millions de dollars. Le projet envisage également un stablecoin indexé sur l'USD sur la blockchain Ethereum pour des paiements pratiques et comme gardien de valeur à long terme. Mutuum Finance est une plateforme DeFi à double prêt et à usages multiples qui profite aussi bien aux emprunteurs qu'aux prêteurs. Elle fournit le réseau aux particuliers ainsi qu'à...
Partager
BitcoinEthereumNews2025/09/18 06:23
Comment acheter Pepeto avant le listing 100x alors que DOGE et ADA maintiennent leur reprise

Comment acheter Pepeto avant le listing 100x alors que DOGE et ADA maintiennent leur reprise

PEPE a transformé de petites entrées en fortunes sans aucun produit vérifié derrière. De plus, plus d'outils vérifiés derrière un projet atteint logiquement plus que ce que
Partager
Techbullion2026/04/01 07:08