Technologia

Vera Rubin od NVIDII: Kolejny skok w dziedzinie obliczeń AI

Na targach CES 2026 NVIDIA zaprezentowała platformę Vera Rubin, obiecującą pięciokrotny wzrost wydajności wnioskowania w porównaniu do Blackwell, dziesięciokrotne obniżenie kosztów tokenów oraz gruntowną przebudowę infrastruktury AI na potrzeby ery agentów AI.

R
Redakcia
Share
Vera Rubin od NVIDII: Kolejny skok w dziedzinie obliczeń AI

Nowa era ogłoszona w Las Vegas

Podczas targów CES 2026 dyrektor generalny NVIDII, Jensen Huang, wkroczył na scenę w Las Vegas, aby zaprezentować najbardziej ambitną platformę sprzętową firmy: Vera Rubin. Nazwana na cześć pionierskiej astronom, która potwierdziła istnienie ciemnej materii, platforma jest następcą rekordowej architektury Blackwell firmy NVIDIA i stanowi pierwszy w pełni współprojektowany, sześciochipowy system superkomputerowy AI firmy. Chipy są już w pełnej produkcji, a produkty w skali szafy serwerowej mają trafić do partnerów chmurowych w drugiej połowie 2026 roku.

Sześć chipów, jeden superkomputer

W przeciwieństwie do poprzednich generacji, Vera Rubin nie jest pojedynczym GPU – jest to zintegrowana platforma składająca się z sześciu współprojektowanych chipów. W jej centrum znajduje się Vera CPU w połączeniu z dwoma Rubin GPU, tworząc jednolity superchip. Platformę uzupełniają cztery komponenty sieciowe i pamięci masowej: NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU i Spectrum-6 Ethernet Switch.

Flagowa konfiguracja, Vera Rubin NVL72, zawiera 72 GPU i 36 CPU w jednej szafie serwerowej, zapewniając oszałamiające 3,6 eksaflopsów wydajności wnioskowania NVFP4. Jej przepustowość skalowania osiąga 260 TB/s – dwukrotnie więcej niż w przypadku Blackwell GB200 NVL72.

Jak wypada w porównaniu z Blackwell

Skok wydajności w porównaniu z Blackwell jest znaczący w każdym kluczowym wskaźniku:

  • Wydajność wnioskowania: 50 PFLOPS na chip – 5× więcej niż Blackwell GB200
  • Przepustowość pamięci: 22 TB/s z pamięcią HBM4 – 2,75× więcej niż HBM3E Blackwell
  • Koszt tokena: Do 10× redukcji kosztów wnioskowania na token
  • Efektywność uczenia: 4× mniej GPU potrzebnych do uczenia modeli mixture-of-experts (MoE)
  • Szybkość montażu: Modułowa, bezprzewodowa konstrukcja tacy umożliwia 18× szybszą obsługę szafy serwerowej

Według Tom's Hardware, Vera Rubin zużyje mniej więcej dwa razy więcej energii niż Blackwell, ale zapewni dziesięciokrotnie większą wydajność na wat – co stanowi znaczący wzrost efektywności dla operatorów hiperskalowych.

Stworzona dla ery agentów AI

NVIDIA pozycjonuje Vera Rubin bezpośrednio na kolejną falę aplikacji AI: systemy agentowe, zaawansowane modele rozumowania i duże architektury mixture-of-experts. Te obciążenia wymagają znacznie większej pojemności pamięci i przepustowości połączeń niż chatboty i generatory obrazów, które zdefiniowały pierwszą falę generatywnej AI.

Wśród pierwszych dostawców usług chmurowych, którzy wdrożą instancje oparte na Vera Rubin, znajdują się AWS, Google Cloud, Microsoft Azure i Oracle Cloud, a także partner chmurowy NVIDII, CoreWeave. Microsoft opublikował już wytyczne dotyczące planowania infrastruktury dla wdrożeń Rubin na dużą skalę w Azure.

Stawka geopolityczna

Premiera ma miejsce w napiętej sytuacji geopolitycznej. NVIDIA wstrzymała eksport chipów H200 do Chin i przekierowała swoje moce produkcyjne TSMC na Vera Rubin, pogłębiając przepaść technologiczną między Stanami Zjednoczonymi a Chinami. Analiza cytowana przez Center for Strategic and International Studies sugeruje, że bez dostępu do zaawansowanych amerykańskich chipów, zdolność obliczeniowa AI Chin w 2026 roku może być ponad dziesięciokrotnie mniejsza niż w USA.

Obserwatorzy branży zauważają, że platformy takie jak Vera Rubin są coraz częściej postrzegane nie tylko jako produkty komercyjne, ale jako infrastruktura strategiczna w globalnej rywalizacji o sztuczną inteligencję ogólną. Jak donosi CNN Business, Vera Rubin skutecznie wyznacza dominację NVIDII na późne lata 20. XXI wieku – mapa drogowa, którą uważnie obserwują rywale w Pekinie.

Co dalej

NVIDIA zasygnalizowała już, że Vera Rubin zostanie zastąpiona architekturą następnej generacji, utrzymując coroczną częstotliwość rozwoju sprzętu firmy. Na razie jednak Vera Rubin ustanawia nowy punkt odniesienia: większa moc obliczeniowa, niższe koszty i konstrukcja szafy serwerowej zbudowana z myślą o industrializacji inteligencji na skalę, jakiej świat jeszcze nie widział.

Ten artykuł jest dostępny także w innych językach:

Powiązane artykuły