Anthropic ha lanzado Claude Sonnet 4.6, un modelo de inteligencia artificial que promete revolucionar la industria al ofrecer un rendimiento casi a la par de los modelos insignia, pero a una fracción de su costo. Este avance llega en un momento crucial, con empresas adoptando masivamente agentes de IA y herramientas de codificación automatizada.
Sonnet 4.6 representa una mejora integral en áreas clave como codificación, uso de computadoras, razonamiento de contexto largo, planificación de agentes, trabajo de conocimiento y diseño. Destaca su ventana de contexto de 1 millón de tokens, actualmente en beta. El modelo se ha convertido en la opción predeterminada en claude.ai y Claude Cowork, manteniendo el precio accesible de sus predecesores.
La principal novedad radica en el precio. Mientras los modelos Opus de Anthropic cuestan cinco veces más, Sonnet 4.6 ofrece un rendimiento comparable para tareas empresariales valiosas. Esto es especialmente significativo para las empresas que despliegan agentes de IA que realizan millones de llamadas a la API diariamente, donde cada dólar ahorrado por millón de tokens se multiplica.
Los resultados en benchmarks son impresionantes. En SWE-bench Verified, una prueba estándar para codificación de software real, Sonnet 4.6 obtiene un 79.6%, muy cerca del 80.8% de Opus 4.6. En el uso de computadoras por agentes (OSWorld-Verified), logra un 72.5%, prácticamente empatado con Opus 4.6. Sorprendentemente, en tareas de oficina (GDPval-AA Elo) supera a Opus 4.6, y en análisis financiero de agentes, Sonnet 4.6 con un 63.3% se posiciona por encima de todos los modelos evaluados, incluido Opus 4.6.
La mejora en la capacidad de uso de computadoras es notable. En solo 16 meses, esta habilidad ha pasado de ser experimental a casi humana, con una puntuación en OSWorld que ha aumentado casi cinco veces. Esta capacidad es crucial para automatizar aplicaciones empresariales que interactúan con software heredado sin APIs.
La adopción por parte de clientes empresariales subraya el impacto de Sonnet 4.6. Usuarios como Hex Technologies y Box han confirmado que el modelo elimina la necesidad de recurrir a las opciones más caras, ofreciendo un rendimiento de nivel Opus a un costo significativamente menor. Los desarrolladores también están viendo mejoras sustanciales en la codificación, especialmente en la navegación y corrección de bases de código extensas.
Además, la ventana de contexto de 1 millón de tokens de Sonnet 4.6 permite un razonamiento efectivo sobre grandes volúmenes de información, demostrando una capacidad de planificación estratégica a largo plazo, como se evidenció en el benchmark Vending-Bench Arena, donde superó significativamente a su predecesor en la simulación de operaciones comerciales.
El lanzamiento de Sonnet 4.6 coincide con la expansión de Anthropic en mercados empresariales y de defensa, incluyendo una nueva asociación con Infosys y la apertura de su primera oficina en India. El modelo supera a competidores como Gemini 3 Pro de Google y GPT-5.2 de OpenAI en varias métricas clave, consolidando la posición de Anthropic en un mercado cada vez más competitivo.
Fuente Original: https://venturebeat.com/technology/anthropics-sonnet-4-6-matches-flagship-ai-performance-at-one-fifth-the-cost
Artículos relacionados de LaRebelión:
- Oceanos Perdidos Costo Climatico Se Duplica
- Universidades de Elite Dominan Contrataciones Vuelve la Antigua Norma
- Estancamiento Laboral El Costo Oculto de la Lealtad
- Isambard-AI El Nuevo Superordenador Britanico se Une a la Elite Mundial
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario