NVIDIA GTC 2026 : Jensen Huang dévoile Vera Rubin et l'IA agentique
La conférence phare de NVIDIA pour les développeurs débute du 16 au 19 mars à San Jose, où le PDG Jensen Huang dévoilera la plateforme Vera Rubin — le successeur de Blackwell avec des performances d'inférence jusqu'à 5 fois supérieures — ainsi que NemoClaw, un système d'agents d'IA open source pour les entreprises, et un aperçu de l'architecture Feynman de prochaine génération.
La plus grande semaine de l'industrie de l'IA commence
Plus de 30 000 participants venant de 190 pays convergent cette semaine vers San Jose, en Californie, pour NVIDIA GTC 2026 (du 16 au 19 mars), la conférence qui n'a cessé de croître, passant d'un rassemblement de développeurs GPU à un sommet annuel de facto de l'industrie mondiale de l'IA. Lundi à 11 heures (heure du Pacifique), le PDG Jensen Huang prendra la parole au SAP Center — domicile des Sharks de San Jose — pour prononcer un discours d'ouverture que les analystes et les ingénieurs suivent avec une intensité inhabituelle.
Ce calendrier n'est pas un hasard. Les entreprises passent désormais massivement des projets pilotes d'IA aux déploiements de production à grande échelle, et les décisions prises lors de GTC 2026 façonneront les investissements en infrastructure pour les deux prochaines années.
Vera Rubin : L'arrivée du successeur de Blackwell
L'annonce phare est la plateforme Vera Rubin, officiellement dévoilée au CES en janvier et dont la disponibilité est prévue pour le second semestre 2026. La plateforme combine un CPU Vera personnalisé — doté de 88 cœurs Armv9 « Olympus » — avec deux GPU Rubin de nouvelle génération dans une seule superpuce. Les chiffres sont frappants : 50 pétaFLOPS de performances d'inférence NVFP4, contre environ 10 PFLOPs pour Blackwell, et une mémoire HBM4 offrant 22 To/s de bande passante par puce, soit une amélioration de 2,8 fois par rapport à la génération précédente.
Selon l'annonce officielle de NVIDIA concernant Rubin, la plateforme réduit également le coût d'inférence par jeton de 10 fois par rapport à Blackwell et réduit de 4 fois le nombre de GPU nécessaires pour entraîner de grands modèles de type « mixture-of-experts ». Les fournisseurs de cloud tels qu'AWS, Microsoft Azure et Google Cloud sont parmi les premiers à déployer des instances basées sur Vera Rubin. Le système de rack lui-même a été repensé — une disposition de plateau sans câble permet un assemblage et une maintenance 18 fois plus rapides que les racks Blackwell.
NemoClaw : Une plateforme d'agents open source pour l'entreprise
Le matériel n'est qu'une partie de l'histoire. Des articles de CNBC et Wired, publiés avant la conférence, ont révélé que NVIDIA présentait discrètement NemoClaw, une plateforme d'agents d'IA open source pour les entreprises, à des partenaires majeurs tels que Salesforce, Cisco, Google, Adobe et CrowdStrike. Conçu pour permettre aux entreprises de déployer des agents autonomes qui traitent les données, gèrent les flux de travail et exécutent des tâches en plusieurs étapes avec une supervision humaine limitée, NemoClaw comprend des outils de sécurité et de confidentialité intégrés — une réponse directe aux préoccupations de confiance qui ont ralenti l'adoption des agents par les entreprises.
Surtout, NVIDIA affirme que la plateforme sera accessible, que les clients utilisent ou non du matériel NVIDIA, un changement stratégique important vers une influence au niveau de la couche logicielle. L'ordre du jour de GTC met explicitement en évidence « les modèles ouverts, les systèmes agentiques et l'IA physique » comme les trois piliers du discours d'ouverture.
Feynman à l'horizon
Au-delà de Vera Rubin, GTC devrait offrir un premier aperçu de Feynman, l'architecture de prochaine génération de NVIDIA, prévue pour 2028. Selon TrendForce, Feynman est prévue pour le processus A16 de 1,6 nm de TSMC et pourrait être pionnière en matière de photonique silicium — utilisant des signaux optiques plutôt qu'électriques — pour franchir les murs de puissance et de bande passante qui limitent déjà la conception des centres de données. Des premiers échantillons, des feuilles de route HBM4 de Samsung et SK Hynix, et un possible CPU x86 co-conçu avec Intel sont tous annoncés pour le salon.
Pourquoi GTC 2026 est important
La conférence arrive à un véritable point d'inflexion. Les dépenses en IA des hyperscalers ont atteint des niveaux records en 2025, mais la prochaine vague de croissance dépend de la capacité des agents autonomes et de l'IA physique — robotique, véhicules autonomes, simulation industrielle — à passer de la démonstration à des systèmes de production fiables. Avec plus de 700 sessions techniques et des partenaires de premier plan couvrant tous les secteurs verticaux, GTC 2026 est moins un événement de lancement de produits qu'un mécanisme de coordination pour une industrie qui réécrit la façon dont le calcul, les logiciels et les systèmes physiques interagissent. Jensen Huang a promis une révélation de puce conçue pour « surprendre le monde ». Le monde regarde.