Mistral presenta Devstral 2, una nueva familia de modelos para escribir y orquestar código, y Mistral Vibe, una CLI nativa que convierte tu terminal en un asistente de ingeniería de software. Si te interesa automatizar tareas reales en proyectos, esto cambia el panorama para desarrolladores, equipos pequeños y quienes quieren correr modelos localmente.
Qué es Devstral 2 y Devstral Small 2
Devstral 2 es un modelo denso de 123B parámetros con ventana de contexto de 256K tokens, y sale bajo una licencia MIT modificada. Devstral Small 2 es la versión pequeña de 24B parámetros, bajo Apache 2.0, pensada para correr en hardware de consumidor o en entornos on-prem.
¿Por qué importa? Porque ambos son open source, permisivos y optimizados para agentes de código: exploran bases de código, entienden dependencias y pueden hacer cambios que afectan múltiples archivos manteniendo contexto de arquitectura.
Devstral Small 2 además soporta entradas de imagen, inference rápida y ejecuciones privadas en dispositivo, ideal para prototipos o equipos que necesitan privacidad y baja latencia.
Rendimiento, eficiencia y comparaciones
- Devstral 2 alcanza 72.2% en SWE-bench Verified, posicionándose como uno de los mejores modelos de código de peso abierto.
- Devstral Small 2 obtiene 68.0% en la misma métrica, compitiendo con modelos varias veces más grandes.
- Mistral afirma que Devstral es hasta 7x más costo-eficiente que Claude Sonnet en tareas del mundo real.
En evaluaciones humanas con un proveedor independiente (y tareas orquestadas con Cline), Devstral 2 superó a DeepSeek R1 con una ventaja clara. Aun así, Claude Sonnet 4.5 sigue siendo preferido en comparación directa, por lo que todavía existe una brecha con algunos modelos cerrados.
"Devstral 2 es la frontera de los modelos de código open-source... entrega una tasa de éxito de llamadas a herramientas comparable con los mejores modelos cerrados." — Cline.
Mistral Vibe CLI: tu agente en la terminal
Mistral Vibe CLI es una herramienta open source bajo Apache 2.0 que convierte tu terminal en un asistente capaz de explorar, modificar y ejecutar cambios en todo un proyecto usando lenguaje natural. Algunas capacidades clave:
- Project-aware context: escanea tu estructura de archivos y el estado de Git para dar contexto relevante.
- Smart references: referencia archivos con
@, ejecuta comandos shell con!y usa slash commands para configuración. - Multi-file orchestration: entiende todo el código, no solo el archivo abierto, lo que puede reducir tiempos de PR a la mitad en tareas complejas.
- Historial persistente, autocompletado y temas personalizables.
Vibe CLI se integra con IDEs vía el Agent Communication Protocol, es programable, permite configurar proveedores y modelos mediante config.toml, y controla permisos de herramientas para ajustarse a tu flujo.
Casos de uso prácticos
- ¿Tienes un monorepo con microservicios? Devstral puede explorar dependencias y proponer cambios coordinados.
- ¿Necesitas arreglar bugs recurrentes o modernizar código legado? El modelo detecta fallos, intenta correcciones y reintenta cuando es necesario.
- ¿Eres un hobbyista con GPU doméstica o incluso sin GPU? Devstral Small 2 está pensado para ti: local, rápido y privado.
Cómo empezar y costos
Devstral 2 está disponible gratis ahora vía API. Tras el periodo gratuito, los precios serán:
- Devstral 2: $0.40 / $2.00 por millón de tokens (input / output)
- Devstral Small 2: $0.10 / $0.30 por millón de tokens (input / output)
Mistral también se integra con herramientas y agentes populares como Kilo Code y Cline, y Vibe CLI está disponible como extensión en Zed para usarlo desde tu IDE.
Recomendaciones de despliegue
- Devstral 2 está optimizado para centros de datos y requiere mínimo 4 GPUs H100 para desplegarse en producción.
- Devstral Small 2 corre en una sola GPU y funciona en muchas configuraciones NVIDIA y también en CPU-only.
- Para un rendimiento estable, Mistral sugiere una temperatura de 0.2 y seguir las mejores prácticas de
Mistral Vibe CLI.
Reflexión final
Esto es importante porque baja barreras: modelos competitivos, licencias permisivas y una CLI nativa que trae agentes al flujo de trabajo diario. Si trabajas con código a escala, la posibilidad de ejecutar un agente que entienda tu repo y haga cambios coherentes puede ahorrar semanas de trabajo repetitivo. ¿Listo para probarlo en un proyecto real y ver si reduce tus PRs a la mitad? Si tienes GPU doméstica, la versión Small es una puerta de entrada muy práctica.
