Análisis
DeepSeek ha lanzado su modelo V4 bajo licencia MIT, presentando mejoras en código y arquitectura orientada a chips chinos, aunque admite estar entre tres y seis meses por detrás de los modelos occidentales líderes. El lanzamiento llega tras un retraso significativo debido a problemas de entrenamiento y alineación técnica, afectando su capacidad para ser multimodal. A pesar de las innovaciones arquitectónicas como TileLang y MegaMoE, el entrenamiento aún dependió de GPUs NVIDIA, y la independencia tecnológica es una aspiración. Paralelamente, el mercado chino de IA se ha reconfigurado, con DeepSeek perdiendo talento clave y buscando financiación externa, lo que plantea interrogantes sobre la narrativa del código abierto chino como alternativa global y la capacidad de DeepSeek para recuperar terreno frente a la brecha en hardware de silicio.
Hechos verificados
- 1DeepSeek ha lanzado su modelo V4 bajo licencia MIT.
- 2El modelo V4 presenta mejoras en código y arquitectura diseñada para chips chinos.
- 3DeepSeek admite estar entre tres y seis meses por detrás de los modelos occidentales punteros.
- 4El desarrollo de V4 sufrió un fallo grave de entrenamiento a mediados de 2025 al migrar infraestructura a chips Huawei Ascend.
- 5El modelo V4 no es multimodal y su desarrollo se pospuso por falta de capacidad de cómputo y financiación.
- 6DeepSeek ha perdido talento clave a manos de competidores como Tencent, ByteDance y Xiaomi.
- 7DeepSeek abre por primera vez una ronda de financiación externa.
