La compañía china Meituan ha revolucionado el panorama de la inteligencia artificial al lanzar LongCat-2.0, un modelo de código abierto con 1.6 billones de parámetros que ha estado liderando silenciosamente las clasificaciones globales de desarrolladores en OpenRouter bajo el nombre anónimo "Owl Alpha". Lo más destacado es que este modelo fue entrenado completamente utilizando chips chinos, demostrando que es posible desarrollar IA de vanguardia sin depender de las tradicionales GPU Nvidia estadounidenses.

LongCat-2.0 se presenta como un sistema de Mezcla de Expertos (MoE) especializado en ingeniería de software autónoma, con una ventana de contexto nativa de 1 millón de tokens. El modelo está disponible bajo la permisiva licencia MIT, lo que permite a las empresas modificarlo e integrarlo libremente en sus aplicaciones comerciales sin restricciones. Meituan ofrece precios altamente competitivos: durante una promoción limitada, los costos son de $0.30 por millón de tokens de entrada y $1.20 por millón de tokens de salida, situándose entre los modelos más económicos del mercado global.
El aspecto técnico más innovador es la arquitectura LongCat Sparse Attention (LSA), que permite manejar contextos masivos sin cuellos de botella. De sus 1.6 billones de parámetros totales, el modelo activa solo entre 33 y 56 mil millones por token, optimizando radicalmente el uso computacional. Esta eficiencia se logra mediante tres vectores: indexación consciente de streaming, indexación entre capas y indexación jerárquica. Además, incorpora un módulo de N-gram Embedding que añade 135 mil millones de parámetros para capturar relaciones locales de tokens.
En términos de rendimiento, LongCat-2.0 destaca especialmente en tareas de programación autónoma, superando a GPT-5.5 de OpenAI en el exigente benchmark SWE-bench Pro con una puntuación de 59.5 frente a 58.6. También registra 70.8 en Terminal-Bench 2.1 y 77.3 en SWE-bench Multilingual. Esta capacidad se debe a su arquitectura de post-entrenamiento MOPD (Multi-Teacher Optimization via Mixture of Specialized Experts), que segrega el entrenamiento en tres grupos especializados: Expertos Agentes para ejecución estructurada, Expertos de Razonamiento para lógica compleja y Expertos de Interacción para alineación humana y seguridad.
El modelo comercial incluye un innovador sistema de "Token Packs" vendidos en ventas flash cuatro veces al día, además del típico pago por uso. Lo revolucionario es que todos los hits de caché de contexto se procesan completamente gratis, eliminando los costos recurrentes cuando los agentes de IA revisan repetidamente los mismos repositorios de código. Esta estrategia hace viable económicamente mantener sesiones extensas de desarrollo autónomo que anteriormente resultaban prohibitivamente costosas.
El lanzamiento cobra especial relevancia en el contexto geopolítico actual, donde el gobierno estadounidense ha presionado a OpenAI y Anthropic para restringir el acceso a sus modelos más avanzados. Mientras Occidente cierra el acceso a sus sistemas propietarios, China abre sus alternativas de código abierto, creando una ventana operativa para desarrolladores globales que buscan herramientas potentes y accesibles. El hecho de que LongCat-2.0 fuera entrenado enteramente en más de 50,000 circuitos integrados de aplicación específica (ASICs) chinos señala un cambio estructural profundo que amenaza el dominio histórico de Nvidia en el entrenamiento de modelos fronterizos.
Artículos relacionados de LaRebelión:
- OpenAI lanza GPT-56 Sol con aprobacion gubernamental
- OpenAI Lanza Su Primer Chip de IA
- IA en Ciencia OpenAI Lanza Pruebas Modelos Fallan Mayoria
- Epic Games Lanza Lore Control de Versiones
- Alibaba Lanza Modelos IA para Robots Autonomos
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario