NVIDIA GTC 2026: Vera Rubin kommt, Feynman in Sicht
Jensen Huang eröffnet die NVIDIA GTC 2026 Konferenz in San Jose mit der offiziellen Vorstellung der Vera Rubin KI-Plattform und einer ersten Vorschau auf die Feynman-Architektur, was NVIDIAs Dominanz im Zeitalter der agentischen und physischen KI untermauert.
Die größte Bühne der KI-Industrie
Die Türen öffneten sich am Sonntag in San Jose, als die NVIDIA GPU Technology Conference 2026 begann. Analysten bezeichnen sie regelmäßig als den "Super Bowl der künstlichen Intelligenz". Mit 30.000 Teilnehmern, die sich im SAP Center versammeln, und Zehntausenden weiteren, die online dabei sind, ist der Einsatz ungewöhnlich hoch – und ungewöhnlich klar. CEO Jensen Huang wird am Montag, den 16. März, um 11 Uhr PT die Hauptbühne betreten, um eine neue Ära des Rechnens zu formalisieren, die auf der Vera Rubin Plattform aufbaut, und um der Industrie einen ersten substanziellen Einblick in ihren Nachfolger, die Feynman-Architektur, zu geben.
Vera Rubin: Vom Produktionsband ins Rampenlicht
Die wichtigste Ankündigung kommt, obwohl die meisten technischen Details bereits im Umlauf sind – was ihre Bedeutung jedoch kaum schmälert. Die Vera Rubin Plattform, benannt nach der bahnbrechenden Astronomin, kombiniert NVIDIAs kundenspezifische Arm-basierte Vera CPU mit der neuen Rubin GPU und befindet sich seit Januar 2026 in Serienproduktion, ein Meilenstein, den Huang auf der CES bestätigte. Auf der GTC wird die Plattform offiziell kommerziell eingeführt.
Die Rubin GPU ist ein beeindruckendes Stück Silizium: 336 Milliarden Transistoren – das 1,6-fache der Anzahl von Blackwell – gefertigt in einem 3nm-Klasse TSMC-Prozess. Acht Stapel von HBM4-Speicher liefern rund 13 TB/s Bandbreite pro GPU, was fast die dreifache Bandbreite ihres Vorgängers ist. In der Flaggschiff-NVL72-Rack-Konfiguration – 72 Rubin-GPUs gepaart mit 36 Vera-CPUs – erreicht die Plattform 3,6 ExaFLOPS NVFP4-Inferenzleistung. NVIDIA behauptet, dass dies zu einer 5-fach höheren Inferenz-Durchsatzrate und 10-fach geringeren Kosten pro Token im Vergleich zu Blackwell führt, Zahlen, die die Investitionsentscheidungen in Rechenzentren für Jahre prägen werden. Eine breite Verfügbarkeit wird in der zweiten Hälfte des Jahres 2026 erwartet, wobei die Hyperscaler AWS, Azure und Google Cloud für den frühen Einsatz bereitstehen.
Ein erster Blick auf Feynman
Huang wird voraussichtlich auch den Vorhang – vorsichtig – für die Feynman-Architektur lüften, die Generation, die für etwa 2028 geplant ist. Frühe technische Signale deuten auf einen 1,6-nm-Prozess mit rückseitiger Stromversorgung und einer Designphilosophie hin, die von Analysten als "Inference-First" beschrieben wird: von Grund auf für die Long-Context-, Multi-Step-Reasoning-Anforderungen agentischer KI-Workloads entwickelt. Wenn NVIDIA den 1,6-nm-Node wie geplant erreicht, würde der Sprung seinen Fertigungsvorsprung gegenüber Wettbewerbern um schätzungsweise zwei bis drei Jahre ausbauen, so Analysten von The Register und Deeper Insights.
Agentische KI und die physische Welt
Über das Silizium hinaus ist die GTC 2026 um zwei zusammenlaufende Themen herum organisiert: agentische KI und physische KI. Agentische Systeme – Modelle, die nicht nur Fragen beantworten, sondern autonom planen, handeln und sich erinnern – erfordern ein grundlegend anderes Rechenprofil: massiven Key-Value-Cache-Speicher, Inferenz mit geringer Latenz und persistenten Kontext. NVIDIA positioniert seine neue Inference Context Memory Storage Plattform und BlueField-4 DPU als die Infrastrukturschicht für diese Verschiebung.
Physische KI ist unterdessen NVIDIAs Versuch, das Betriebssystem der globalen Industrie zu werden. Durch Omniverse und die Isaac-Robotikplattform ermöglicht das Unternehmen Herstellern und Logistikbetreibern, ganze Fabriken als digitale Zwillinge zu simulieren, bevor ein einziger Roboter eine Schraube dreht. Partner wie ABB Robotics – dessen RobotStudio nun mit Omniverse die Lücke zwischen Simulation und Realität mit einer Genauigkeit von 99 % schließt – und Foxconn führen bereits Pilotprojekte durch.
Ein Lackmustest für die KI-Wirtschaft
Die GTC 2026 kommt an einem Wendepunkt. Der Blackwell-Zyklus bescherte NVIDIA Rekordumsätze, aber Investoren beobachten, ob der Vera Rubin-Anstieg diese Entwicklung angesichts des zunehmenden Wettbewerbs durch kundenspezifisches Silizium bei den Hyperscalern aufrechterhalten kann. Huangs Keynote wird nicht nur auf Chip-Spezifikationen hin untersucht, sondern auch auf Signale in Bezug auf Nachfrage, Software-Burggräben und wie tief NVIDIA beabsichtigt, sich in Robotik und Industrieautomation zu verankern. Die Antwort, gemessen am Konferenzprogramm, lautet: sehr tief.
Bleib auf dem Laufenden!
Folge uns auf Facebook für die neuesten Nachrichten und Artikel.
Folge uns auf Facebook