NVIDIA GTC 2026: Jensen Huang enthüllt Vera Rubin und Agentic AI
Die wichtigste Entwicklerkonferenz von NVIDIA beginnt vom 16. bis 19. März in San Jose. CEO Jensen Huang wird die Vera Rubin-Plattform vorstellen – den Nachfolger von Blackwell mit bis zu 5-facher Inferenzleistung – zusammen mit NemoClaw, einem Open-Source-KI-Agentensystem für Unternehmen, und einem Ausblick auf die nächste Generation der Feynman-Architektur.
Die wichtigste Woche der KI-Branche beginnt
Mehr als 30.000 Teilnehmer aus 190 Ländern strömen diese Woche nach San Jose, Kalifornien, zur NVIDIA GTC 2026 (16.–19. März), der Konferenz, die sich von einem Treffen von GPU-Entwicklern zu dem jährlichen Gipfeltreffen der globalen KI-Branche entwickelt hat. Am Montag um 11:00 Uhr PT wird CEO Jensen Huang im SAP Center – der Heimat der San Jose Sharks – die Bühne betreten, um eine Keynote zu halten, die von Analysten und Ingenieuren gleichermaßen mit ungewöhnlicher Intensität verfolgt wird.
Der Zeitpunkt ist kein Zufall. Unternehmen gehen jetzt aggressiv von KI-Pilotprojekten zu umfassenden Produktionsimplementierungen über, und die auf der GTC 2026 getroffenen Entscheidungen werden die Infrastrukturinvestitionen für die nächsten zwei Jahre prägen.
Vera Rubin: Der Nachfolger von Blackwell kommt
Die wichtigste Ankündigung ist die Vera Rubin-Plattform, die im Januar auf der CES offiziell vorgestellt wurde und nun in der zweiten Jahreshälfte 2026 verfügbar sein soll. Die Plattform kombiniert eine kundenspezifische Vera-CPU – mit 88 Armv9 "Olympus"-Kernen – mit zwei Rubin-GPUs der nächsten Generation in einem einzigen Superchip. Die Zahlen sind beeindruckend: 50 PetaFLOPS NVFP4-Inferenzleistung, verglichen mit Blackwells etwa 10 PFLOPs, und HBM4-Speicher, der 22 TB/s Bandbreite pro Chip liefert, eine 2,8-fache Verbesserung gegenüber der vorherigen Generation.
Laut NVIDIAs offizieller Rubin-Ankündigung senkt die Plattform auch die Inferenzkosten pro Token um das 10-fache gegenüber Blackwell und reduziert die Anzahl der GPUs, die zum Trainieren großer Mixture-of-Experts-Modelle benötigt werden, um das 4-fache. Cloud-Anbieter wie AWS, Microsoft Azure und Google Cloud gehören zu den ersten, die Vera Rubin-basierte Instanzen bereitstellen. Das Rack-System selbst wurde neu gestaltet – ein kabelloses Tray-Layout ermöglicht eine 18-mal schnellere Montage und Wartung als bei Blackwell-Racks.
NemoClaw: Eine Open-Source-Agentenplattform für Unternehmen
Hardware ist nur ein Teil der Geschichte. Berichte von CNBC und Wired im Vorfeld der Konferenz enthüllten, dass NVIDIA im Stillen NemoClaw, eine Open-Source-KI-Agentenplattform für Unternehmen, wichtigen Partnern wie Salesforce, Cisco, Google, Adobe und CrowdStrike vorgestellt hat. NemoClaw wurde entwickelt, um Unternehmen die Bereitstellung autonomer Agenten zu ermöglichen, die Daten verarbeiten, Workflows verwalten und mehrstufige Aufgaben mit begrenzter menschlicher Aufsicht ausführen. Es umfasst integrierte Sicherheits- und Datenschutztools – eine direkte Reaktion auf Vertrauensbedenken, die die Einführung von Agenten in Unternehmen verlangsamt haben.
Entscheidend ist, dass NVIDIA angibt, dass die Plattform unabhängig davon zugänglich sein wird, ob Kunden NVIDIA-Hardware verwenden, eine bedeutende strategische Verlagerung hin zu Software-Layer-Einfluss. Die GTC-Agenda hebt explizit "offene Modelle, Agentensysteme und physische KI" als die drei Säulen der Keynote hervor.
Feynman am Horizont
Über Vera Rubin hinaus wird von der GTC erwartet, dass sie einen ersten Blick auf Feynman, NVIDIAs Architektur der übernächsten Generation, die auf 2028 abzielt, bietet. Laut TrendForce ist Feynman für den 1,6-nm-A16-Prozess von TSMC vorgesehen und könnte Pionierarbeit bei der Siliziumphotonik leisten – wobei optische anstelle von elektrischen Signalen verwendet werden –, um Leistungs- und Bandbreitenbeschränkungen zu überwinden, die das Design von Rechenzentren bereits einschränken. Frühe Samples, HBM4-Roadmaps von Samsung und SK Hynix sowie eine möglicherweise gemeinsam entwickelte x86-CPU, die mit Intel gebaut wurde, werden alle für die Konferenzfläche gemunkelt.
Warum die GTC 2026 wichtig ist
Die Konferenz findet an einem echten Wendepunkt statt. Die KI-Ausgaben von Hyperscalern erreichten im Jahr 2025 Rekordwerte, aber die nächste Wachstumswelle hängt davon ab, ob autonome Agenten und physische KI – Robotik, autonome Fahrzeuge, industrielle Simulation – von der Demonstration zu zuverlässigen Produktionssystemen übergehen können. Mit über 700 technischen Sitzungen und hochkarätigen Partnern, die jede Branche abdecken, ist die GTC 2026 weniger eine Produkteinführungsveranstaltung als ein Koordinationsmechanismus für eine Branche, die die Interaktion von Berechnung, Software und physischen Systemen neu schreibt. Jensen Huang versprach eine Chip-Enthüllung, die die "Welt überraschen" soll. Die Welt schaut zu.
Bleib auf dem Laufenden!
Folge uns auf Facebook für die neuesten Nachrichten und Artikel.
Folge uns auf Facebook