NVIDIA a frappé fort lors de son GTC 2026 en dévoilant Vera Rubin, sa nouvelle plateforme IA de référence qui succède à l’architecture Blackwell. Combinant un CPU Vera et deux GPU Rubin dans un superchip unique, cette plateforme est conçue pour l’ère de l’IA agentique et du raisonnement à grande échelle.
Sept puces, un écosystème
La plateforme Vera Rubin ne se limite pas à un simple processeur. Elle intègre sept composants distincts : le superchip Vera Rubin lui-même, le switch NVLink 6, le SuperNIC ConnectX-9, le DPU BlueField-4, le switch Ethernet Spectrum-6, et depuis mars 2026, l’accélérateur d’inférence basse latence Groq 3 LPX. Chacun de ces éléments est optimisé pour un maillon spécifique de la chaîne IA, de l’entraînement au déploiement en production.
Cette approche intégrée permet à NVIDIA de proposer une solution clé en main aux data centers, éliminant les problèmes d’interopérabilité qui ralentissent souvent les déploiements à grande échelle.
Des gains de performance considérables
Les chiffres annoncés par NVIDIA sont impressionnants. Par rapport aux systèmes Blackwell actuels, Vera Rubin promet une réduction par 4 du nombre de GPU nécessaires pour entraîner un modèle de type Mixture of Experts (MoE), et une réduction par 10 du coût des tokens en inférence. Des améliorations qui pourraient démocratiser l’accès aux modèles de grande taille pour les entreprises qui n’ont pas les budgets des géants de la tech.
La plateforme est spécifiquement conçue pour gérer les workflows à contexte long et la résolution de problèmes en plusieurs étapes, deux caractéristiques essentielles des agents IA autonomes qui émergent comme le prochain paradigme d’utilisation de l’intelligence artificielle.
Disponibilité et premiers clients
Vera Rubin est en production complète et les premiers produits basés sur cette architecture seront disponibles au second semestre 2026. Parmi les premiers déployeurs : AWS, Google Cloud, Microsoft Azure et Oracle Cloud. Un casting de poids qui confirme que les hyperscalers considèrent cette plateforme comme l’infrastructure de référence pour la prochaine génération de services IA.
Avec Vera Rubin, NVIDIA consolide sa domination sur le marché de l’infrastructure IA et se positionne clairement sur le créneau de l’IA agentique — un segment que le CEO Jensen Huang qualifie de « point d’inflexion de l’inférence ». Pour les entreprises qui planifient leurs investissements en infrastructure, c’est une donnée qui change l’équation.



