NVIDIA GTC 2026: Vera Rubin kommt, Feynman in Sicht

Die größte Bühne der KI-Industrie

Die Türen öffneten sich am Sonntag in San Jose, als die NVIDIA GPU Technology Conference 2026 begann. Analysten bezeichnen sie regelmäßig als den "Super Bowl der künstlichen Intelligenz". Mit 30.000 Teilnehmern, die sich im SAP Center versammeln, und Zehntausenden weiteren, die online dabei sind, ist der Einsatz ungewöhnlich hoch – und ungewöhnlich klar. CEO Jensen Huang wird am Montag, den 16. März, um 11 Uhr PT die Hauptbühne betreten, um eine neue Ära des Rechnens zu formalisieren, die auf der Vera Rubin Plattform aufbaut, und um der Industrie einen ersten substanziellen Einblick in ihren Nachfolger, die Feynman-Architektur, zu geben.

Vera Rubin: Vom Produktionsband ins Rampenlicht

Die wichtigste Ankündigung kommt, obwohl die meisten technischen Details bereits im Umlauf sind – was ihre Bedeutung jedoch kaum schmälert. Die Vera Rubin Plattform, benannt nach der bahnbrechenden Astronomin, kombiniert NVIDIAs kundenspezifische Arm-basierte Vera CPU mit der neuen Rubin GPU und befindet sich seit Januar 2026 in Serienproduktion, ein Meilenstein, den Huang auf der CES bestätigte. Auf der GTC wird die Plattform offiziell kommerziell eingeführt.

Die Rubin GPU ist ein beeindruckendes Stück Silizium: 336 Milliarden Transistoren – das 1,6-fache der Anzahl von Blackwell – gefertigt in einem 3nm-Klasse TSMC-Prozess. Acht Stapel von HBM4-Speicher liefern rund 13 TB/s Bandbreite pro GPU, was fast die dreifache Bandbreite ihres Vorgängers ist. In der Flaggschiff-NVL72-Rack-Konfiguration – 72 Rubin-GPUs gepaart mit 36 Vera-CPUs – erreicht die Plattform 3,6 ExaFLOPS NVFP4-Inferenzleistung. NVIDIA behauptet, dass dies zu einer 5-fach höheren Inferenz-Durchsatzrate und 10-fach geringeren Kosten pro Token im Vergleich zu Blackwell führt, Zahlen, die die Investitionsentscheidungen in Rechenzentren für Jahre prägen werden. Eine breite Verfügbarkeit wird in der zweiten Hälfte des Jahres 2026 erwartet, wobei die Hyperscaler AWS, Azure und Google Cloud für den frühen Einsatz bereitstehen.

Ein erster Blick auf Feynman

Huang wird voraussichtlich auch den Vorhang – vorsichtig – für die Feynman-Architektur lüften, die Generation, die für etwa 2028 geplant ist. Frühe technische Signale deuten auf einen 1,6-nm-Prozess mit rückseitiger Stromversorgung und einer Designphilosophie hin, die von Analysten als "Inference-First" beschrieben wird: von Grund auf für die Long-Context-, Multi-Step-Reasoning-Anforderungen agentischer KI-Workloads entwickelt. Wenn NVIDIA den 1,6-nm-Node wie geplant erreicht, würde der Sprung seinen Fertigungsvorsprung gegenüber Wettbewerbern um schätzungsweise zwei bis drei Jahre ausbauen, so Analysten von The Register und Deeper Insights.

Agentische KI und die physische Welt

Über das Silizium hinaus ist die GTC 2026 um zwei zusammenlaufende Themen herum organisiert: agentische KI und physische KI. Agentische Systeme – Modelle, die nicht nur Fragen beantworten, sondern autonom planen, handeln und sich erinnern – erfordern ein grundlegend anderes Rechenprofil: massiven Key-Value-Cache-Speicher, Inferenz mit geringer Latenz und persistenten Kontext. NVIDIA positioniert seine neue Inference Context Memory Storage Plattform und BlueField-4 DPU als die Infrastrukturschicht für diese Verschiebung.

Physische KI ist unterdessen NVIDIAs Versuch, das Betriebssystem der globalen Industrie zu werden. Durch Omniverse und die Isaac-Robotikplattform ermöglicht das Unternehmen Herstellern und Logistikbetreibern, ganze Fabriken als digitale Zwillinge zu simulieren, bevor ein einziger Roboter eine Schraube dreht. Partner wie ABB Robotics – dessen RobotStudio nun mit Omniverse die Lücke zwischen Simulation und Realität mit einer Genauigkeit von 99 % schließt – und Foxconn führen bereits Pilotprojekte durch.

Ein Lackmustest für die KI-Wirtschaft

Die GTC 2026 kommt an einem Wendepunkt. Der Blackwell-Zyklus bescherte NVIDIA Rekordumsätze, aber Investoren beobachten, ob der Vera Rubin-Anstieg diese Entwicklung angesichts des zunehmenden Wettbewerbs durch kundenspezifisches Silizium bei den Hyperscalern aufrechterhalten kann. Huangs Keynote wird nicht nur auf Chip-Spezifikationen hin untersucht, sondern auch auf Signale in Bezug auf Nachfrage, Software-Burggräben und wie tief NVIDIA beabsichtigt, sich in Robotik und Industrieautomation zu verankern. Die Antwort, gemessen am Konferenzprogramm, lautet: sehr tief.

NVIDIA GTC 2026: Vera Rubin kommt, Feynman in Sicht

Die größte Bühne der KI-Industrie

Vera Rubin: Vom Produktionsband ins Rampenlicht

Ein erster Blick auf Feynman

Agentische KI und die physische Welt

Ein Lackmustest für die KI-Wirtschaft

Verwandte Artikel

So funktioniert die Air Force One – Das fliegende Weiße Haus

Wie der EU-Zivilschutzmechanismus funktioniert

Wie US-Militärbasen in Europa funktionieren – und warum

Wie die Intelligenz von Kraken funktioniert – ein verteilter Geist

So funktioniert die Air Force One – Das fliegende Weiße Haus

So funktioniert die Triple Crown – Der härteste Preis im Pferderennsport

Wie NASAs SPHEREx den gesamten Himmel in 102 Farben kartiert

Wie die Präsidentschaft im UN-Sicherheitsrat rotiert

Verpassen Sie keine neuen Artikel!