Anthropic presentó Claude Sonnet 4.5 el 29 de septiembre de 2025, una versión que, según la compañía, redefine cómo los modelos usan computadoras y resuelven problemas de software complejos. ¿Su promesa? Ser el mejor modelo para programar, crear agentes y trabajar con herramientas en la práctica. (anthropic.com)
Qué trae Claude Sonnet 4.5
Claude Sonnet 4.5 llega con una batería de mejoras orientadas a desarrolladores y equipos productivos:
- Rendimiento de vanguardia en programación y razonamiento matemático, con saltos notables en benchmarks de uso real. (anthropic.com)
- Mejora en uso de computadoras y ejecución paralela de acciones, lo que ayuda a automatizar tareas complejas dentro de un mismo flujo. (anthropic.com)
- Nuevas funciones en Claude Code: puntos de control que guardan tu progreso, interfaz de terminal renovada y una extensión nativa para VS Code. (anthropic.com)
- Capacidades dentro de las apps: ejecución de código y creación de archivos (hojas de cálculo, diapositivas y documentos) directamente en la conversación. (anthropic.com)
- Un SDK para agentes, llamado Claude Agent SDK, que permite a los desarrolladores replicar la infraestructura que usa Anthropic para sus productos. (anthropic.com)
"Claude Sonnet 4.5 es el mejor modelo de código en el mundo". Esa afirmación es central en el anuncio y viene acompañada de resultados y testimonios de clientes. (anthropic.com)
Resultados y métricas clave
Anthropic publicó números concretos para mostrar la mejora. En OSWorld, un benchmark de tareas en computadora, Sonnet 4.5 alcanza 61.4 por ciento frente al 42.2 por ciento de Sonnet 4 hace cuatro meses. Además, describen comportamientos sostenidos en tareas largas, con el modelo manteniendo foco por más de 30 horas en flujos complejos. Estos datos apuntalan la promesa de que Sonnet 4.5 puede encargarse de proyectos de largo aliento sin perder coherencia. (anthropic.com)
También mencionan mejoras internas en edición de código, detección de vulnerabilidades y aumentos en métricas de planificación y evaluaciones end to end reportadas por clientes tempranos. (anthropic.com)
Disponibilidad y precio
Claude Sonnet 4.5 está disponible desde el día del anuncio para desarrolladores y usuarios de las apps. En la API se accede usando claude-sonnet-4-5
. Anthropic mantiene el mismo esquema de precios que Sonnet 4: 3 dólares y 15 dólares por cada millón de tokens, según el uso que publiques. Si te interesa probarlo, puedes encontrarlo en la plataforma de Claude o en la documentación para desarrolladores. (anthropic.com)
Seguridad y alineamiento
Un punto importante es que Anthropic califica a Sonnet 4.5 como su modelo frontier más alineado hasta la fecha. Dicen haber reducido comportamientos problemáticos como adulación, engaño y tendencias a incentivar pensamientos delirantes. El modelo se publica bajo las protecciones de AI Safety Level 3 y usan clasificadores para filtrar contenidos riesgosos, especialmente en áreas críticas como CBRN. También afirman haber disminuido falsos positivos en esos clasificadores desde versiones anteriores. (anthropic.com)
Para desarrolladores y equipos
Si trabajas en productos que requieren automatización, agentes o integración profunda con código, las novedades relevantes son:
- El Claude Agent SDK, que trae la infraestructura de agentes usada por Anthropic para que la adaptes a tus casos.
- Mejoras en Claude Code que facilitan flujos de trabajo largos, con checkpoints y mejor edición de código.
- Integraciones prácticas en apps y extensiones como la de Chrome y VS Code para adoptar esas capacidades en tu día a día. (anthropic.com)
Además, Anthropic lanzó una preview investigativa llamada "Imagine with Claude", una demo que genera software en tiempo real disponible para suscriptores Max por un tiempo limitado, ideal para ver el potencial del modelo en acción. (anthropic.com)
¿Qué significa esto para ti?
¿Te parece solo otra mejora incremental? Puede que no. Si tu trabajo depende de manejar código complejo, automatizar tareas largas o construir agentes que interactúen con herramientas y archivos, Sonnet 4.5 llega con componentes prácticos para acelerar esos flujos. También incluye medidas de seguridad más estrictas, aunque siempre será prudente validar resultados críticos por humanos antes de pasar a producción. (anthropic.com)
Si quieres leer el anuncio original y ver los detalles técnicos, la nota oficial está en la página de Anthropic: Introducing Claude Sonnet 4.5. (anthropic.com)