Technológia

NVIDIA Vera Rubin: A következő ugrás a mesterséges intelligencia számítástechnikában

Az NVIDIA a CES 2026-on mutatta be a Vera Rubin platformot, amely a Blackwell teljesítményének ötszörösét, a tokenköltség tizedére csökkenését és a mesterséges intelligencia infrastruktúrájának átfogó áttervezését ígéri az ágensi AI korszak számára.

R
Redakcia
Share
NVIDIA Vera Rubin: A következő ugrás a mesterséges intelligencia számítástechnikában

Új korszakot jelentettek be Las Vegasban

A CES 2026-on az NVIDIA vezérigazgatója, Jensen Huang Las Vegasban színpadra lépett, hogy bemutassa a vállalat eddigi legambiciózusabb hardverplatformját: a Vera Rubint. A sötét anyag létezését megerősítő úttörő csillagászról elnevezett platform az NVIDIA rekordokat döntő Blackwell architektúrájának utódja, és a vállalat első teljes mértékben közösen tervezett, hat chipből álló AI szuperszámítógépes rendszere. A chipek már teljes gyártásban vannak, és a rack-méretű termékek várhatóan 2026 második felében érkeznek meg a felhőszolgáltató partnerekhez.

Hat chip, egy szuperszámítógép

A korábbi generációktól eltérően a Vera Rubin nem egyetlen GPU – hanem hat, közösen tervezett chip integrált platformja. A magját a Vera CPU alkotja, amelyhez két Rubin GPU párosul, egységes szuperchipet alkotva. A platformot négy hálózati és tároló komponens egészíti ki: az NVLink 6 Switch, a ConnectX-9 SuperNIC, a BlueField-4 DPU és a Spectrum-6 Ethernet Switch.

A zászlóshajó konfiguráció, a Vera Rubin NVL72 72 GPU-t és 36 CPU-t tömörít egyetlen rackbe, ami elképesztő 3,6 exaflops NVFP4 következtetési teljesítményt nyújt. A vertikális skálázási sávszélessége eléri a 260 TB/s-ot – ami a Blackwell GB200 NVL72 kétszerese.

Hogyan viszonyul a Blackwellhez

A Blackwellhez képest a teljesítménybeli ugrás minden kulcsfontosságú mutatóban jelentős:

  • Következtetési teljesítmény: 50 PFLOPS chipenként – 5× magasabb, mint a Blackwell GB200
  • Memória sávszélesség: 22 TB/s HBM4 memóriával – 2,75× több, mint a Blackwell HBM3E-je
  • Tokenköltség: Akár 10× csökkenés a következtetés tokenenkénti költségében
  • Képzési hatékonyság: 4× kevesebb GPU szükséges a mixture-of-experts (MoE) modellek képzéséhez
  • Összeszerelési sebesség: A moduláris, kábelmentes tálcás kialakítás 18× gyorsabb rack-szervizelést tesz lehetővé

A Tom's Hardware szerint a Vera Rubin körülbelül kétszer annyi energiát fog fogyasztani, mint a Blackwell, de tízszer nagyobb teljesítményt nyújt wattonként – ami jelentős hatékonyságnövekedés a hiperszkálázó operátorok számára.

Az ágensi AI korszakra építve

Az NVIDIA a Vera Rubint egyértelműen a mesterséges intelligencia alkalmazások következő hullámára pozicionálja: ágensi rendszerekre, fejlett következtetési modellekre és nagyméretű mixture-of-experts architektúrákra. Ezek a munkaterhelések sokkal nagyobb memóriakapacitást és összekapcsolási sávszélességet igényelnek, mint a chatbotok és a képgenerátorok, amelyek meghatározták a generatív AI első hullámát.

A Vera Rubin alapú példányok bevezetésére készülő első felhőszolgáltatók között szerepel az AWS, a Google Cloud, a Microsoft Azure és az Oracle Cloud, valamint az NVIDIA felhőpartnere, a CoreWeave. A Microsoft már közzétett infrastruktúra-tervezési útmutatót a nagyméretű Rubin telepítésekhez az Azure-on.

Geopolitikai tétek

A bejelentés feszült geopolitikai háttérrel érkezik. Az NVIDIA leállította a H200 chipek Kínába irányuló exportját, és a TSMC gyártási kapacitását a Vera Rubin felé irányította át, elmélyítve a technológiai szakadékot az Egyesült Államok és Kína között. A Stratégiai és Nemzetközi Tanulmányok Központja által idézett elemzés szerint, ha Kína nem fér hozzá a fejlett amerikai chipekhez, a mesterséges intelligencia számítási kapacitása 2026-ban több mint tízszer kisebb lehet, mint az Egyesült Államoké.

Az iparági megfigyelők megjegyzik, hogy az olyan platformokat, mint a Vera Rubin, egyre inkább nem csupán kereskedelmi termékeknek, hanem a mesterséges általános intelligenciáért folyó globális versenyben stratégiai infrastruktúrának tekintik. Ahogy a CNN Business beszámolt róla, a Vera Rubin hatékonyan feltérképezi az NVIDIA dominanciáját a 2020-as évek végéig – egy olyan ütemtervet, amelyet a pekingi riválisok szorosan figyelnek.

Mi következik

Az NVIDIA már jelezte, hogy a Vera Rubint egy következő generációs architektúra fogja felváltani, fenntartva a vállalat hardverfejlesztésének éves ütemét. Egyelőre azonban a Vera Rubin új mércét állít fel: több számítási teljesítményt, alacsonyabb költséget és egy olyan rack-kialakítást, amely az intelligencia iparosítására épül olyan mértékben, amilyet a világ még nem látott.

Ez a cikk más nyelveken is elérhető:

Kapcsolódó cikkek