Vera Rubin od NVIDIE: Ďalší míľnik v oblasti AI výpočtov
Spoločnosť NVIDIA predstavila na CES 2026 platformu Vera Rubin, ktorá sľubuje päťnásobne vyšší výkon pri inferencii v porovnaní s Blackwell, desaťnásobné zníženie nákladov na token a rozsiahle prepracovanie AI infraštruktúry pre éru agentívnej AI.
Nová éra ohlásená v Las Vegas
Na CES 2026 sa generálny riaditeľ spoločnosti NVIDIA, Jensen Huang, postavil na pódium v Las Vegas, aby predstavil doposiaľ najambicióznejšiu hardvérovú platformu spoločnosti: Vera Rubin. Platforma, pomenovaná po priekopníckej astronómke, ktorá potvrdila existenciu tmavej hmoty, nadväzuje na rekordnú architektúru Blackwell od NVIDIE a predstavuje prvý plne spoločne navrhnutý šesťčipový AI superpočítačový systém spoločnosti. Čipy sú už v plnej výrobe a produkty v rozsahu rackov by mali doraziť k cloudovým partnerom v druhej polovici roka 2026.
Šesť čipov, jeden superpočítač
Na rozdiel od predchádzajúcich generácií, Vera Rubin nie je jediný GPU – je to integrovaná platforma šiestich spoločne navrhnutých čipov. V jej jadre sedí Vera CPU spárovaný s dvoma Rubin GPU, ktoré tvoria jednotný superčip. Platformu dopĺňajú štyri sieťové a úložné komponenty: NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU a Spectrum-6 Ethernet Switch.
Vlajková konfigurácia, Vera Rubin NVL72, obsahuje 72 GPU a 36 CPU v jednom racku, čím poskytuje ohromujúcich 3,6 exaflopov inferenčného výkonu NVFP4. Jej škálovateľná šírka pásma dosahuje 260 TB/s – dvojnásobok oproti Blackwell GB200 NVL72.
Ako sa porovnáva s Blackwell
Výkonnostný skok oproti Blackwell je značný v každej kľúčovej metrike:
- Inferenčný výkon: 50 PFLOPS na čip – 5× vyšší ako Blackwell GB200
- Šírka pásma pamäte: 22 TB/s s pamäťou HBM4 – 2,75× viac ako HBM3E od Blackwell
- Náklady na token: Až 10× zníženie nákladov na inferenciu na token
- Efektivita trénovania: 4× menej GPU potrebných na trénovanie modelov mixture-of-experts (MoE)
- Rýchlosť montáže: Modulárny dizajn bez káblov umožňuje 18× rýchlejší servis racku
Podľa Tom's Hardware, Vera Rubin spotrebuje približne dvojnásobok energie Blackwell, ale poskytne desaťnásobne vyšší výkon na watt – čo je významný nárast efektivity pre hyperscale operátorov.
Postavené pre éru agentívnej AI
NVIDIA umiestňuje Vera Rubin priamo do ďalšej vlny AI aplikácií: agentívnych systémov, pokročilých modelov uvažovania a rozsiahlych architektúr mixture-of-experts. Tieto pracovné zaťaženia si vyžadujú oveľa väčšiu kapacitu pamäte a šírku pásma prepojenia ako chatboty a generátory obrázkov, ktoré definovali prvú generatívnu AI vlnu.
Medzi prvých poskytovateľov cloudu, ktorí nasadia inštancie založené na Vera Rubin, patria AWS, Google Cloud, Microsoft Azure a Oracle Cloud, ako aj cloudový partner NVIDIE, CoreWeave. Spoločnosť Microsoft už zverejnila pokyny pre plánovanie infraštruktúry pre rozsiahle nasadenia Rubin na Azure.
Geopolitické stávky
Uvedenie na trh prichádza v napätej geopolitickej situácii. Spoločnosť NVIDIA zastavila vývoz čipov H200 do Číny a presmerovala svoju výrobnú kapacitu TSMC na Vera Rubin, čím prehĺbila technologickú priepasť medzi Spojenými štátmi a Čínou. Analýza citovaná Centrom pre strategické a medzinárodné štúdie naznačuje, že bez prístupu k pokročilým americkým čipom by mohla byť výpočtová kapacita AI v Číne v roku 2026 viac ako desaťkrát menšia ako v USA.
Odborníci z odvetvia poznamenávajú, že platformy ako Vera Rubin sa čoraz viac vnímajú nielen ako komerčné produkty, ale ako strategická infraštruktúra v globálnom boji o umelú všeobecnú inteligenciu. Ako uviedla CNN Business, Vera Rubin efektívne mapuje dominanciu spoločnosti NVIDIA až do konca 20. rokov 21. storočia – plán, ktorý rivali v Pekingu pozorne sledujú.
Čo bude nasledovať
Spoločnosť NVIDIA už signalizovala, že Vera Rubin bude nahradená architektúrou novej generácie, čím si spoločnosť udrží ročný rytmus pokroku v oblasti hardvéru. Zatiaľ však Vera Rubin stanovuje nový štandard: viac výpočtového výkonu, nižšie náklady a dizajn racku vytvorený pre industrializáciu inteligencie v rozsahu, aký svet ešte nevidel.