NVIDIA GTC 2026 : Vera Rubin ouvre l'ère de l'IA agentique
Jensen Huang monte sur scène à San José le 16 mars pour dévoiler la plateforme Vera Rubin de NVIDIA et une puce mystère, traçant la voie pour l'IA physique, les systèmes agentiques et les usines d'IA en 2026 et au-delà.
La plus grande semaine de l'industrie de l'IA commence
Lorsque Jensen Huang montera sur scène au SAP Center de San José le lundi 16 mars, environ 30 000 participants de plus de 190 pays seront présents en personne, et des millions d'autres en ligne. La GPU Technology Conference annuelle de NVIDIA a été surnommée le "Super Bowl de l'intelligence artificielle", et l'édition 2026 pourrait être la plus importante à ce jour. Pendant quatre jours (du 16 au 19 mars), GTC présentera l'architecture matérielle, logicielle et commerciale qui définira l'infrastructure de l'IA pour les prochaines années.
Vera Rubin : L'arrivée du successeur de Blackwell
La pièce maîtresse de GTC 2026 est le lancement commercial officiel de la plateforme Vera Rubin, le successeur de l'architecture Blackwell de NVIDIA, qui a battu tous les records. Présentée pour la première fois au CES en janvier, Rubin représente un véritable saut générationnel : elle offre jusqu'à 5 fois les performances d'inférence de Blackwell, triple presque la bande passante de la mémoire et est la première plateforme GPU à adopter la mémoire HBM4. Le résultat est une réduction revendiquée de 10 fois du coût par jeton d'inférence, un chiffre qui compte énormément pour les hyperscalers exécutant des milliards de requêtes d'IA par jour.
Le superchip Rubin associe deux GPU à double matrice à un tout nouveau CPU Arm à 88 cœurs, co-conçu à partir de zéro. NVIDIA affirme que les produits Rubin seront livrés par les partenaires au cours du second semestre 2026, avec AWS, Google Cloud, Microsoft Azure et Oracle Cloud parmi les premiers à déployer des instances basées sur Vera Rubin, selon l'annonce officielle de la société.
Huang a également fait allusion à une puce mystère, quelque chose qui, selon lui, "surprendra le monde", suggérant que GTC comprendra au moins une annonce au-delà de la feuille de route Rubin déjà connue. Un aperçu de l'architecture Feynman, prévue pour 2028 et conçue comme une plateforme d'inférence de premier plan pour les charges de travail d'IA agentique, est également attendu.
Au-delà du matériel : IA agentique et physique
Le matériel n'est qu'une partie de l'histoire. NVIDIA a articulé GTC 2026 autour de trois vagues convergentes : l'IA agentique (systèmes qui agissent de manière autonome dans le cadre de tâches en plusieurs étapes), l'IA physique (robots et automatisation industrielle alimentés par Isaac et Omniverse) et les usines d'IA, des systèmes de centres de données verticalement intégrés, construits spécifiquement pour produire des résultats d'IA à grande échelle. Les analystes de SiliconAngle notent que NVIDIA se repositionne non pas simplement comme un vendeur de puces, mais comme l'architecte d'une pile de production d'IA de bout en bout.
Le spectacle d'avant-match précédant le discours d'Huang met en vedette les PDG de Perplexity, LangChain, Mistral AI et d'autres, signalant à quel point l'écosystème logiciel d'IA au sens large s'est organisé autour des plateformes de NVIDIA.
Les partenaires complètent l'écosystème
Le géant du stockage KIOXIA fait partie des dizaines de partenaires présents à GTC qui présentent des solutions adaptées aux charges de travail d'IA. La société présente sa technologie AiSAQ, qui transfère la recherche de bases de données vectorielles d'IA de la DRAM coûteuse vers des SSD NVMe à haute capacité, ce qui pourrait réduire les coûts d'infrastructure pour les déploiements de grands modèles linguistiques. Les SSD d'entreprise CM9 et LC9 de KIOXIA, ce dernier offrant jusqu'à 245 To par disque en utilisant la mémoire flash QLC 3D NAND, sont directement destinés au stockage à l'échelle des usines d'IA.
Les investisseurs observent attentivement
Wall Street suit de près. Les actions de NVIDIA ont augmenté avant la conférence, plusieurs analystes maintenant des objectifs de cours haussiers : Vivek Arya de Bank of America maintient un objectif de 300 $, tandis qu'Ivan Feinseth de Tigress Financial l'a relevé à 360 $, selon TipRanks. Pourtant, le sentiment n'est pas uniformément euphorique : l'action a perdu 14 % par rapport à son pic post-bénéfices du début du mois de mars, les investisseurs s'interrogeant sur le rendement à court terme des dépenses d'infrastructure d'IA. GTC est donc un moment critique pour démontrer que les usines d'IA génèrent une valeur économique réelle et mesurable, et pas seulement des chiffres de référence impressionnants.
Les enjeux pour l'ensemble de l'industrie
Ce que NVIDIA annoncera cette semaine aura des répercussions : la tarification du cloud, les feuilles de route des concurrents, les décisions de financement des startups et les calendriers d'adoption de l'IA par les entreprises suivent tous le rythme de NVIDIA. Si Vera Rubin tient sa promesse de coût par jeton et que la vision de l'IA agentique gagne du terrain, 2026 pourrait marquer le point d'inflexion où l'IA passe du stade expérimental au stade opérationnel à l'échelle mondiale.