Technologie

NVIDIA GTC 2026 : Vera Rubin arrive, Feynman en perspective

Jensen Huang ouvre la conférence GTC 2026 de NVIDIA à San José avec le lancement officiel de la plateforme d'IA Vera Rubin et un aperçu de l'architecture Feynman, consolidant la domination de NVIDIA à l'ère de l'IA agentique et physique.

R
Redakcia
4 min de lecture
Share
NVIDIA GTC 2026 : Vera Rubin arrive, Feynman en perspective

La plus grande scène de l'industrie de l'IA

Les portes se sont ouvertes dimanche à San José, marquant le coup d'envoi de la GPU Technology Conference 2026 de NVIDIA, que les analystes qualifient régulièrement de « Super Bowl de l'intelligence artificielle ». Avec 30 000 participants convergeant vers le SAP Center et des dizaines de milliers d'autres se joignant en ligne, les enjeux sont exceptionnellement élevés – et exceptionnellement clairs. Le PDG Jensen Huang montera sur scène le lundi 16 mars à 11 heures (heure du Pacifique) pour officialiser une nouvelle ère informatique construite autour de la plateforme Vera Rubin et pour offrir le premier aperçu substantiel de son successeur, l'architecture Feynman.

Vera Rubin : de la chaîne de production au centre de la scène

L'annonce principale arrive avec la plupart de ses détails techniques déjà en circulation – mais cela ne diminue en rien son importance. La plateforme Vera Rubin, du nom de l'astronome pionnière, associe le CPU Vera personnalisé basé sur Arm de NVIDIA au nouveau GPU Rubin et est en production en série depuis janvier 2026, une étape que Huang a confirmée au CES. Le GTC est l'endroit où la plateforme reçoit son lancement commercial officiel.

Le GPU Rubin est une pièce de silicium formidable : 336 milliards de transistors – 1,6 fois le nombre de Blackwell – fabriqués sur un processus TSMC de classe 3 nm. Huit piles de mémoire HBM4 offrent environ 13 To/s de bande passante par GPU, triplant presque la bande passante de son prédécesseur. Dans la configuration phare de rack NVL72 – 72 GPU Rubin associés à 36 CPU Vera – la plateforme atteint 3,6 exaFLOPS de performances d'inférence NVFP4. NVIDIA affirme que cela se traduit par un débit d'inférence 5 fois supérieur et un coût par jeton 10 fois inférieur par rapport à Blackwell, des chiffres qui façonneront les décisions d'investissement des centres de données pendant des années. Une large disponibilité est prévue au second semestre 2026, avec les hyperscalers AWS, Azure et Google Cloud prêts pour un déploiement précoce.

Un premier aperçu de Feynman

Huang devrait également lever le voile – avec prudence – sur l'architecture Feynman, la génération prévue pour environ 2028. Les premiers signaux techniques indiquent un processus de 1,6 nm avec alimentation par l'arrière et une philosophie de conception décrite par les analystes comme « l'inférence d'abord » : construite à partir de zéro pour les exigences de raisonnement à long contexte et en plusieurs étapes des charges de travail d'IA agentique. Si NVIDIA parvient au nœud de 1,6 nm comme prévu, le saut prolongerait son avance en matière de fabrication sur ses rivaux d'environ deux à trois ans, selon les analystes de The Register et Deeper Insights.

L'IA agentique et le monde physique

Au-delà du silicium, le GTC 2026 est organisé autour de deux thèmes convergents : l'IA agentique et l'IA physique. Les systèmes agentiques – des modèles qui ne se contentent pas de répondre aux questions, mais qui planifient, agissent et se souviennent de manière autonome – nécessitent un profil de calcul fondamentalement différent : stockage massif de cache clé-valeur, inférence à faible latence et contexte persistant. NVIDIA positionne sa nouvelle plateforme Inference Context Memory Storage et BlueField-4 DPU comme la couche d'infrastructure pour ce changement.

L'IA physique, quant à elle, est la tentative de NVIDIA de devenir le système d'exploitation de l'industrie mondiale. Grâce à Omniverse et à la plateforme de robotique Isaac, l'entreprise permet aux fabricants et aux opérateurs logistiques de simuler des usines entières en tant que jumeaux numériques avant même qu'un seul robot ne serre une vis. Des partenaires tels que ABB Robotics – dont RobotStudio comble désormais le fossé entre la simulation et la réalité avec une précision de 99 % grâce à Omniverse – et Foxconn mènent déjà des projets pilotes.

Un test décisif pour l'économie de l'IA

Le GTC 2026 arrive à un point d'inflexion. Le cycle Blackwell a généré des revenus records pour NVIDIA, mais les investisseurs surveillent si la montée en puissance de Vera Rubin peut maintenir cette trajectoire face à la concurrence croissante du silicium personnalisé chez les hyperscalers. Le discours d'ouverture de Huang sera examiné non seulement pour les spécifications des puces, mais aussi pour les signaux concernant la demande, les barrières logicielles et la profondeur avec laquelle NVIDIA a l'intention de s'intégrer dans la robotique et l'automatisation industrielle. La réponse, à en juger par le programme de la conférence, est : très profondément, en effet.

Cet article est également disponible dans d'autres langues :

Articles connexes