Gemma 4: IA multimodal abierta que corre en dispositivo

Gemma 4 llega como un paquete completo: modelo abierto bajo Apache 2, multimodal (texto, imagen, audio, video), tamaños pensados para correr desde tu laptop hasta un servidor, y con resultados que en muchos casos funcionan de forma excelente sin necesitar fine-tuning.

Qué hay de nuevo con Gemma 4

Gemma 4 combina ideas probadas y mejoras puntuales para ofrecer una familia de modelos práctica y eficiente:

Licencia Apache 2 y checkpoints abiertos para uso y despliegue libre.
Multimodal: texto + imagen + video; las variantes pequeñas también procesan audio.
Diseñada para correr en muchas infraestructuras: Transformers, llama.cpp, MLX, WebGPU, Rust, ONNX y más.
Cuatro tamaños base, todos con checkpoint base e instrucción afinada: E2B (2.3B efectiva), E4B (4.5B efectiva), 31B denso y 26B A4B (MoE 4B activas).
Contexto largo: 128k para E2B/E4B y 256k para los grandes.

¿La conclusión rápida? Modelos que puedes probar hoy mismo, incluso en dispositivo, y con un diseño pensado para ser eficiente al cuantizar.

Qué hay de nuevo con Gemma 4

Arquitectura y detalles técnicos

Rendimiento y métricas

Capacidades multimodales y ejemplos prácticos

Despliegue: dónde y cómo ejecutarlo

Fine-tuning, entrenamiento y demos

Reflexión práctica: ¿qué puedes hacer hoy?

Fuente original

¡Mantente al día!

Gemma 4: IA multimodal abierta que corre en dispositivo