La startup china DeepSeek ha vuelto a sacudir el mundo de la inteligencia artificial con el lanzamiento de sus modelos DeepSeek-V4-Pro y DeepSeek-V4-Flash, aproximadamente un año después de que su modelo R1 provocara lo que Marc Andreessen denominó el "momento Sputnik de la IA". Ambos modelos fueron publicados en Hugging Face como versiones preliminares y mantienen la filosofía de código abierto que caracteriza a la compañía, permitiendo a los desarrolladores usar y modificar libremente el código fuente.

El avance técnico más destacado de V4 es su Arquitectura de Atención Híbrida, que mejora significativamente la capacidad del modelo para mantener el contexto en conversaciones largas. Con una ventana de contexto de 1 millón de tokens, suficiente para procesar una base de código completa o un documento del tamaño de un libro en un solo prompt, esta arquitectura está diseñada para tareas de razonamiento agéntico y de largo alcance. La variante Flash está optimizada para velocidad y eficiencia de costos, mientras que la versión Pro se enfoca en máximo rendimiento.
Según los benchmarks propios de DeepSeek, V4-Pro se posiciona como el modelo de código abierto más potente en programación y matemáticas, quedando por detrás únicamente del Gemini 3.1-Pro de Google en conocimiento general. En una evaluación inusualmente honesta, la compañía admite que su trayectoria de desarrollo va aproximadamente de 3 a 6 meses por detrás de los modelos de frontera de código cerrado como GPT-5.4 de OpenAI y Gemini 3.1-Pro, cayendo solo "marginalmente por debajo" de estos.
El aspecto geopolíticamente más relevante es que DeepSeek colaboró con fabricantes chinos de chips de IA como Huawei y Cambricon para optimizar V4 para su hardware más reciente, rompiendo la práctica estándar de dar acceso temprano a Nvidia o AMD. Ejecutar un modelo de clase frontera en los chips Ascend de Huawei, en lugar de los H100 o H200 de Nvidia, representa una prueba de concepto significativa para la cadena de suministro nacional china de hardware de IA, que ha estado bajo restricciones de exportación estadounidenses desde octubre de 2022.
El momento del lanzamiento no es casual. El modelo R1 de DeepSeek, lanzado en enero de 2025, borró aproximadamente 600 mil millones de dólares de la capitalización de mercado de Nvidia en un solo día, obligando a los inversores a recalibrar sus suposiciones sobre el poder de cómputo necesario para construir IA de frontera. V4 llega a un mercado diferente y más competitivo, donde la competencia entre Estados Unidos y China en IA se ha convertido en una dimensión explícita de las políticas comerciales y tecnológicas. Estas son versiones preliminares y aún esperan evaluación independiente para confirmar las afirmaciones de rendimiento de DeepSeek.
Fuente Original: https://thenextweb.com/news/deepseek-v4-pro-flash-launch-open-source
Artículos relacionados de LaRebelión:
- OpenAI Lanza Workspace Agents Revolucion Empresarial IA
- OpenAIs Privacy Filter Open-Source Data Protection
- Mozilla Thunderbolt Open-Source AI with Self-Hosting Control
- Calcom Abandons Open Source Citing AI Security Threats
- Trafico LLM Convierte Aprovecha la Nueva Era
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario