Vera Rubin de NVIDIA: El próximo gran salto en la computación de IA
NVIDIA presentó la plataforma Vera Rubin en el CES 2026, prometiendo cinco veces el rendimiento de inferencia de Blackwell, una reducción de diez veces en el costo por token y un rediseño radical de la infraestructura de IA para la era de la IA agentiva.
Un nuevo amanecer anunciado en Las Vegas
En el CES 2026, el CEO de NVIDIA, Jensen Huang, subió al escenario en Las Vegas para presentar la plataforma de hardware más ambiciosa de la compañía hasta la fecha: Vera Rubin. Nombrada en honor a la pionera astrónoma que confirmó la existencia de la materia oscura, la plataforma sucede a la arquitectura Blackwell de NVIDIA, que batió récords, y representa el primer sistema de supercomputación de IA de seis chips totalmente codiseñado de la compañía. Los chips ya están en plena producción, y los productos a escala de rack llegarán a los socios de la nube en la segunda mitad de 2026.
Seis chips, una supercomputadora
A diferencia de las generaciones anteriores, Vera Rubin no es una sola GPU, sino una plataforma integrada de seis chips codiseñados. En su núcleo se encuentra la Vera CPU emparejada con dos Rubin GPUs, formando un superchip unificado. Completan la plataforma cuatro componentes de red y almacenamiento: el NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU y Spectrum-6 Ethernet Switch.
La configuración insignia, la Vera Rubin NVL72, incluye 72 GPU y 36 CPU en un solo rack, lo que ofrece un asombroso rendimiento de inferencia de 3,6 exaflops de NVFP4. Su ancho de banda de escalamiento alcanza los 260 TB/s, el doble que el de la Blackwell GB200 NVL72.
Cómo se compara con Blackwell
El salto de rendimiento con respecto a Blackwell es sustancial en todas las métricas clave:
- Rendimiento de inferencia: 50 PFLOPS por chip: 5 veces más que Blackwell GB200
- Ancho de banda de memoria: 22 TB/s con memoria HBM4: 2,75 veces más que la HBM3E de Blackwell
- Costo por token: Hasta 10 veces menos en el costo de inferencia por token
- Eficiencia de entrenamiento: Se necesitan 4 veces menos GPU para entrenar modelos de mezcla de expertos (MoE)
- Velocidad de ensamblaje: El diseño modular de bandeja sin cables permite un servicio de rack 18 veces más rápido
Según Tom's Hardware, Vera Rubin consumirá aproximadamente el doble de energía que Blackwell, pero ofrecerá diez veces más rendimiento por vatio, una ganancia de eficiencia significativa para los operadores de hiperescala.
Construida para la era de la IA agentiva
NVIDIA está posicionando a Vera Rubin directamente en la próxima ola de aplicaciones de IA: sistemas agentivos, modelos de razonamiento avanzados y arquitecturas grandes de mezcla de expertos. Estas cargas de trabajo exigen una capacidad de memoria y un ancho de banda de interconexión mucho mayores que los chatbots y los generadores de imágenes que definieron la primera ola de IA generativa.
Entre los primeros proveedores de la nube que implementarán instancias basadas en Vera Rubin se encuentran AWS, Google Cloud, Microsoft Azure y Oracle Cloud, así como el socio de la nube de NVIDIA, CoreWeave. Microsoft ya ha publicado una guía de planificación de infraestructura para implementaciones de Rubin a gran escala en Azure.
Implicaciones geopolíticas
El lanzamiento se produce en un contexto geopolítico tenso. NVIDIA ha detenido las exportaciones de chips H200 a China y ha redirigido su capacidad de producción de TSMC hacia Vera Rubin, profundizando la brecha tecnológica entre Estados Unidos y China. Un análisis citado por el Centro de Estudios Estratégicos e Internacionales sugiere que, sin acceso a chips estadounidenses avanzados, la capacidad de computación de IA de China en 2026 podría ser más de diez veces menor que la de Estados Unidos.
Los observadores de la industria señalan que plataformas como Vera Rubin se consideran cada vez más no solo como productos comerciales, sino como infraestructura estratégica en la contienda global por la inteligencia artificial general. Como informó CNN Business, Vera Rubin traza efectivamente el dominio de NVIDIA hasta finales de la década de 2020, una hoja de ruta que los rivales en Beijing están observando de cerca.
Qué sigue
NVIDIA ya ha señalado que Vera Rubin será sucedida por una arquitectura de próxima generación, manteniendo la cadencia anual de la compañía de avance de hardware. Por ahora, sin embargo, Vera Rubin establece un nuevo punto de referencia: más computación, menor costo y un diseño de rack construido para la industrialización de la inteligencia a una escala que el mundo aún no ha visto.