Technológie

Vera Rubin od NVIDIE: Ďalší míľnik v oblasti AI výpočtov

Spoločnosť NVIDIA predstavila na CES 2026 platformu Vera Rubin, ktorá sľubuje päťnásobne vyšší výkon pri inferencii v porovnaní s Blackwell, desaťnásobné zníženie nákladov na token a rozsiahle prepracovanie AI infraštruktúry pre éru agentívnej AI.

R
Redakcia
Share
Vera Rubin od NVIDIE: Ďalší míľnik v oblasti AI výpočtov

Nová éra ohlásená v Las Vegas

Na CES 2026 sa generálny riaditeľ spoločnosti NVIDIA, Jensen Huang, postavil na pódium v Las Vegas, aby predstavil doposiaľ najambicióznejšiu hardvérovú platformu spoločnosti: Vera Rubin. Platforma, pomenovaná po priekopníckej astronómke, ktorá potvrdila existenciu tmavej hmoty, nadväzuje na rekordnú architektúru Blackwell od NVIDIE a predstavuje prvý plne spoločne navrhnutý šesťčipový AI superpočítačový systém spoločnosti. Čipy sú už v plnej výrobe a produkty v rozsahu rackov by mali doraziť k cloudovým partnerom v druhej polovici roka 2026.

Šesť čipov, jeden superpočítač

Na rozdiel od predchádzajúcich generácií, Vera Rubin nie je jediný GPU – je to integrovaná platforma šiestich spoločne navrhnutých čipov. V jej jadre sedí Vera CPU spárovaný s dvoma Rubin GPU, ktoré tvoria jednotný superčip. Platformu dopĺňajú štyri sieťové a úložné komponenty: NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU a Spectrum-6 Ethernet Switch.

Vlajková konfigurácia, Vera Rubin NVL72, obsahuje 72 GPU a 36 CPU v jednom racku, čím poskytuje ohromujúcich 3,6 exaflopov inferenčného výkonu NVFP4. Jej škálovateľná šírka pásma dosahuje 260 TB/s – dvojnásobok oproti Blackwell GB200 NVL72.

Ako sa porovnáva s Blackwell

Výkonnostný skok oproti Blackwell je značný v každej kľúčovej metrike:

  • Inferenčný výkon: 50 PFLOPS na čip – 5× vyšší ako Blackwell GB200
  • Šírka pásma pamäte: 22 TB/s s pamäťou HBM4 – 2,75× viac ako HBM3E od Blackwell
  • Náklady na token:10× zníženie nákladov na inferenciu na token
  • Efektivita trénovania: 4× menej GPU potrebných na trénovanie modelov mixture-of-experts (MoE)
  • Rýchlosť montáže: Modulárny dizajn bez káblov umožňuje 18× rýchlejší servis racku

Podľa Tom's Hardware, Vera Rubin spotrebuje približne dvojnásobok energie Blackwell, ale poskytne desaťnásobne vyšší výkon na watt – čo je významný nárast efektivity pre hyperscale operátorov.

Postavené pre éru agentívnej AI

NVIDIA umiestňuje Vera Rubin priamo do ďalšej vlny AI aplikácií: agentívnych systémov, pokročilých modelov uvažovania a rozsiahlych architektúr mixture-of-experts. Tieto pracovné zaťaženia si vyžadujú oveľa väčšiu kapacitu pamäte a šírku pásma prepojenia ako chatboty a generátory obrázkov, ktoré definovali prvú generatívnu AI vlnu.

Medzi prvých poskytovateľov cloudu, ktorí nasadia inštancie založené na Vera Rubin, patria AWS, Google Cloud, Microsoft Azure a Oracle Cloud, ako aj cloudový partner NVIDIE, CoreWeave. Spoločnosť Microsoft už zverejnila pokyny pre plánovanie infraštruktúry pre rozsiahle nasadenia Rubin na Azure.

Geopolitické stávky

Uvedenie na trh prichádza v napätej geopolitickej situácii. Spoločnosť NVIDIA zastavila vývoz čipov H200 do Číny a presmerovala svoju výrobnú kapacitu TSMC na Vera Rubin, čím prehĺbila technologickú priepasť medzi Spojenými štátmi a Čínou. Analýza citovaná Centrom pre strategické a medzinárodné štúdie naznačuje, že bez prístupu k pokročilým americkým čipom by mohla byť výpočtová kapacita AI v Číne v roku 2026 viac ako desaťkrát menšia ako v USA.

Odborníci z odvetvia poznamenávajú, že platformy ako Vera Rubin sa čoraz viac vnímajú nielen ako komerčné produkty, ale ako strategická infraštruktúra v globálnom boji o umelú všeobecnú inteligenciu. Ako uviedla CNN Business, Vera Rubin efektívne mapuje dominanciu spoločnosti NVIDIA až do konca 20. rokov 21. storočia – plán, ktorý rivali v Pekingu pozorne sledujú.

Čo bude nasledovať

Spoločnosť NVIDIA už signalizovala, že Vera Rubin bude nahradená architektúrou novej generácie, čím si spoločnosť udrží ročný rytmus pokroku v oblasti hardvéru. Zatiaľ však Vera Rubin stanovuje nový štandard: viac výpočtového výkonu, nižšie náklady a dizajn racku vytvorený pre industrializáciu inteligencie v rozsahu, aký svet ešte nevidel.

Tento článok je dostupný aj v iných jazykoch:

Zostaňte v obraze!

Sledujte nás na Facebooku a nič vám neunikne.

Sledujte nás na Facebooku

Podobné články