DeepSeek V4: La IA multimodal de un billón de parámetros de China
El laboratorio chino de IA DeepSeek se prepara para lanzar V4, su primer modelo insignia nativamente multimodal, optimizado para los chips domésticos de Huawei y Cambricon en lugar del hardware de Nvidia, y listo para lanzarse bajo una licencia de código abierto que podría sacudir nuevamente los mercados globales de IA.
¿Otro disparo escuchado en todo el mundo de la IA?
Poco más de un año después de que su modelo de razonamiento R1 desencadenara lo que los analistas llamaron un "momento Sputnik" para las empresas tecnológicas estadounidenses, el laboratorio chino de IA DeepSeek está preparando su próximo gran lanzamiento. Según informes de TechNode, citando al Financial Times, la compañía planeaba presentar DeepSeek V4 durante la primera semana de marzo de 2026, estratégicamente programado antes de las reuniones parlamentarias anuales de China, las "Dos Sesiones", que comenzaron el 4 de marzo.
El lanzamiento marca el primer lanzamiento importante de un modelo de la compañía desde que R1 debutó en enero de 2025, y representa un importante paso adelante en ambición: V4 se describe como un sistema nativamente multimodal capaz de generar texto, imágenes y video dentro de una única arquitectura unificada, en lugar de agregar capacidades visuales a una base de solo texto, como han hecho muchos modelos occidentales.
Qué hace diferente a V4
La arquitectura del modelo se basa en un diseño de Mixture-of-Experts (MoE), con filtraciones tempranas de entornos de prueba que sugieren alrededor de un billón de parámetros totales y aproximadamente 32 mil millones de parámetros activos por pasada de inferencia. Este enfoque, que enruta cada consulta a través de solo una fracción de la red completa, es el mismo truco de eficiencia que DeepSeek utilizó en modelos anteriores para ofrecer un rendimiento de vanguardia a un costo computacional dramáticamente menor.
Según múltiples informes que agregan datos de referencia tempranos, las pruebas internas indican que V4 puede superar a los modelos occidentales líderes, incluidos Claude y ChatGPT, en tareas de codificación de contexto largo, con una ventana de contexto que, según los informes, se extiende a un millón de tokens. Estas cifras aún no se han verificado de forma independiente a través de puntos de referencia publicados y deben tratarse con precaución hasta que se publiquen los resultados oficiales.
Si se confirma, las implicaciones de precios por sí solas serían disruptivas. Los analistas estiman que el acceso a la API podría costar entre $0.10 y $0.30 por millón de tokens de entrada, una fracción de lo que cobran actualmente los modelos estadounidenses comparables.
La dimensión del hardware
Quizás el aspecto geopolíticamente más significativo de V4 es lo que lo ejecuta. DeepSeek trabajó con los fabricantes chinos de chips de IA Huawei y Cambricon para optimizar V4 para su hardware más reciente, según TechNode. En una notable desviación de las normas de la industria, la compañía retuvo el acceso anticipado a Nvidia y AMD, los proveedores de chips estadounidenses dominantes, y en su lugar otorgó a Huawei acceso anticipado para ajustar el rendimiento.
"Acelerar los plazos de optimización, ahora comprimidos de meses a semanas, reduce la dependencia del proveedor y debilita las ventajas tradicionales de los fabricantes de chips", señaló el analista Ben Bajarin de Creative Strategies, citado por Open Source For You. La medida es una señal deliberada: China está construyendo una pila de software de IA que se ejecuta en silicio chino.
El código abierto como arma estratégica
DeepSeek planea lanzar V4 bajo una licencia de código abierto, continuando un patrón que le ha dado al laboratorio una influencia global desmesurada. Sus modelos anteriores han acumulado más de 75 millones de descargas en Hugging Face, lo que permite a los desarrolladores de todo el mundo implementarlos y ajustarlos sin tarifas de licencia.
Esta estrategia de código abierto amplifica la presión competitiva sobre OpenAI, Anthropic y Google, cuyos modelos propietarios enfrentan un desafío de costo y accesibilidad que ninguna respuesta regulatoria puede abordar fácilmente. Como observó el Digital Watch Observatory, los analistas ven cada lanzamiento de DeepSeek como un refuerzo del posicionamiento del laboratorio como un campeón nacional de IA de facto para China, independientemente de si esa era la intención original.
Qué viene después
La carrera más amplia se está acelerando en ambos lados. Una variante más ligera "V4 Lite" con alrededor de 200 mil millones de parámetros, según los informes, ha entrado en pruebas internas, ampliando las opciones de implementación. Mientras tanto, los laboratorios occidentales de IA están observando de cerca: Anthropic, a fines de febrero de 2026, acusó públicamente a DeepSeek y a otros laboratorios chinos de ejecutar campañas a gran escala para extraer capacidades del modelo a través de la recopilación de datos no autorizada, una acusación que subraya cuán en serio se toma ahora la industria estadounidense la amenaza competitiva.
Ya sea que V4 cumpla o no con sus especificaciones filtradas, la trayectoria de DeepSeek es clara: lanzamientos más rápidos, inferencia más barata, pesos abiertos y hardware que evita los controles de exportación de EE. UU. El panorama global de la IA tiene un nuevo retador permanente.