Claude Sonnet 4.6: IA más capaz con contexto de 1M tokens

17 feb 2026Keryc Díaz4 minutos

Claude Sonnet 4.6 ya está aquí y promete ser el Sonnet más capaz hasta la fecha. ¿Qué significa eso para ti, tu equipo o tu negocio? En términos prácticos: mejor código, mejor uso de aplicaciones en pantalla, razonamiento más largo y un contexto beta de 1 millón de tokens que puede contener contratos, bases de código o bibliotecas de investigación completas en una sola consulta.

Qué trae Sonnet 4.6

Sonnet 4.6 es una actualización amplia: mejoras en coding, uso de computadoras, razonamiento con contexto largo, planificación tipo agente, trabajo de conocimiento y diseño. Para quienes usan claude.ai y Claude Cowork en planes Free y Pro, Sonnet 4.6 ya es el modelo por defecto. El precio no cambia respecto a Sonnet 4.5: empieza en $3/$15 por millón de tokens.

Sonnet 4.6 mejora consistencia, seguimiento de instrucciones y reduce repeticiones inútiles en el código. En pruebas tempranas, desarrolladores prefirieron Sonnet 4.6 frente a Sonnet 4.5 en aproximadamente 70% de los casos, y frente a Opus 4.5 en 59% de las comparaciones por ser menos propenso a sobreingeniería y más fiable en seguimientos multi paso.

Uso de computador: por qué importa

Pensar en una IA que usa una computadora como lo haría una persona cambia el juego. Antes, automatizar software viejo o especializado requería conectores a medida. Ahora el modelo puede interactuar con interfaces, hacer clics y teclear en una máquina virtual, lo que amplía las tareas que puedes delegar: navegar hojas de cálculo complejas, llenar formularios multi paso o orquestar trabajo entre varias pestañas.

OSWorld, el benchmark estándar para este tipo de tareas, muestra mejoras consistentes a lo largo de 16 meses. Aun así, Sonnet 4.6 no es perfecto: todavía está por detrás de los humanos más hábiles en ciertas maniobras finas. Pero el avance es notable y ya resulta útil en muchos flujos de trabajo reales.

Importante: el uso de computadoras abre vectores de riesgo, como ataques de prompt injection. Anthropic dice que Sonnet 4.6 muestra mayor resistencia frente a Sonnet 4.5 y rendimiento similar a Opus 4.6. Revisa las prácticas de mitigación en la documentación de la API.

Rendimiento y evaluaciones clave

Sonnet 4.6 aumenta rendimiento en múltiples benchmarks y tareas reales: OfficeQA (documentos empresariales), Vending-Bench Arena (estrategia de negocio simulada), evaluaciones de razonamiento profundo y bug-fixing a gran escala.

La ventana de contexto de 1M tokens en beta permite mantener código entero, contratos largos o decenas de papers en una sola solicitud, y lo más importante: razonar a través de todo eso. En Vending-Bench Arena, Sonnet 4.6 mostró estrategias de planificación a largo plazo que le dieron ventaja frente a competidores.

Clientes reportaron mejoras concretas: frontends más pulidos, análisis financiero más claros, menos iteraciones para llegar a producción y mejor detección de bugs. Ejemplo práctico: Rakuten AI obtuvo iOS code con mejor cumplimiento de especificaciones y arquitectura moderna en una sola pasada.

Productos y herramientas: dónde está disponible

Sonnet 4.6 ya está en claude.ai, Claude Cowork, Claude Code, la API y principales nubes.
Se actualizó la free tier para usar Sonnet 4.6 por defecto, incluyendo creación de archivos, connectors y compaction.
En la plataforma para desarrolladores: soporta adaptive thinking, extended thinking y compaction de contexto en beta (resumen automático de contexto antiguo).
En el API: búsqueda web y fetch ahora pueden escribir y ejecutar código para filtrar resultados, mejorando calidad de respuesta y eficiencia de tokens. Code execution, memoria, llamadas programáticas a herramientas y ejemplos de uso están generalmente disponibles.
Para usuarios de Claude en Excel: el add-in ahora soporta conectores MCP con proveedores financieros clave (S&P Global, LSEG, PitchBook, FactSet, entre otros) en planes Pro, Max, Team y Enterprise.

Seguridad y límites

Anthropic reporta que Sonnet 4.6 pasó extensas evaluaciones de seguridad y describen su carácter como "cálido, honesto, prosocial y a veces gracioso", con fuertes comportamientos de seguridad y sin señales de fallos graves de alineamiento. Aun así, recuerda: ningún benchmark captura por completo el riesgo del mundo real. La recomendación práctica es probar en entornos controlados, monitorear salidas y aplicar mitigaciones contra inyecciones y mal uso.

Cómo empezar hoy

Si eres desarrollador, usa el identificador claude-sonnet-4-6 en la API para migrar. Prueba distintos niveles de esfuerzo/latencia para encontrar el equilibrio entre velocidad y calidad según tu caso de uso. Si dependes de Opus para tareas muy críticas de razonamiento profundo, Anthropic sugiere que Opus 4.6 sigue siendo la mejor opción para esos escenarios ultra exigentes.

Sonnet 4.6 es especialmente atractivo si buscas rendimiento cercano a frontera a un costo más eficiente: mejor relación rendimiento-costo, menos iteraciones para producción y capacidades ampliadas en tareas de código y documentos.

Reflexión final

No es solo un número de versión: Sonnet 4.6 representa cómo la IA se vuelve más práctica para trabajo real —desde arreglar bugs en grandes codebases hasta procesar contratos extensos— y lo hace conservando precio y escalabilidad. ¿Listo para probarlo en tu flujo de trabajo? Empieza con un experimento controlado y verás en qué tareas te ahorra más tiempo.

Fuente original

https://www.anthropic.com/news/claude-sonnet-4-6

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.