Gemini 2.5 de Google: Flash‑Lite, precios y disponibilidad

3 minutos
GOOGLE
Gemini 2.5 de Google: Flash‑Lite, precios y disponibilidad

El 17 de junio de 2025 Google publicó una actualización importante sobre la familia Gemini 2.5: nuevas versiones, ajustes de precios y fechas de transición que conviene conocer si usas estos modelos en producción.

Qué anunció Google sobre Gemini 2.5

Google presenta oficialmente cambios en la familia Gemini 2.5, incluyendo la disponibilidad general de Gemini 2.5 Pro y Flash, y el lanzamiento en preview de Gemini 2.5 Flash-Lite. Estos anuncios buscan ofrecer opciones más rápidas y económicas para distintos casos de uso. (deepmind.google)

Novedades principales que importan

  • Gemini 2.5 Flash-Lite llega en preview como la opción con menor latencia y costo dentro de la familia. Está pensado para tareas de alto volumen como clasificación o resúmenes a escala. Por defecto la capacidad de "pensar" (razonamiento interno) viene desactivada para priorizar velocidad y costo. (deepmind.google)

  • Gemini 2.5 Flash se estabiliza y Google actualiza su esquema de precios: sube el costo por 1M de tokens de entrada a 0.30 USD, baja el costo por 1M de tokens de salida a 2.50 USD, y elimina la diferencia de precio entre modos con y sin "pensamiento". Esto simplifica la facturación para desarrolladores. (deepmind.google)

  • Gemini 2.5 Pro se declara estable y sigue siendo la opción orientada a tareas que requieren mayor inteligencia, como codificación o agentes que toman decisiones. Google señala una demanda muy alta por Pro y la mantiene con el mismo punto de precio. (deepmind.google)

Fechas operativas y de deprecación

Si estás usando endpoints de preview debes planear la migración: la versión Preview de Gemini 2.5 Flash con precios antiguos se mantendrá hasta el 15 de julio de 2025, cuando ese endpoint será apagado. También hay referencias a ventanas de disponibilidad para previews de Pro que requieren migración antes de las fechas señaladas. Revisa tus strings de modelo y actualiza a gemini-2.5-flash o gemini-2.5-pro según corresponda. (deepmind.google)

Qué significa esto para tu proyecto

¿Tienes una app que necesita respuestas rápidas y baratas o prefieres la mayor capacidad de razonamiento? Ahora tienes opciones claras:

  • Para throughput y costos bajos elige Flash-Lite y activa el pensamiento solo cuando lo necesites.
  • Para tareas complejas de programación, agentes o análisis profundo, Pro sigue siendo la mejor alternativa.

Ejemplo concreto: si construyes un servicio de resúmenes diarios para miles de usuarios, Flash-Lite puede reducir la latencia y la factura. Si construyes un asistente que escribe código o coordina acciones, Pro es la elección más segura.

Recomendaciones prácticas

  1. Revisa las llamadas a la API y reemplaza los identificadores de modelo antiguos por gemini-2.5-flash, gemini-2.5-flash-lite (preview) o gemini-2.5-pro según tu caso de uso. (deepmind.google)
  2. Prueba con los parámetros de "thinking" en entornos de staging para medir coste-beneficio. Flash-Lite trae el pensamiento apagado por defecto, pero puedes activarlo si necesitas más precisión.
  3. Monitorea el consumo de tokens y latencia tras migrar para ajustar el presupuesto y la configuración.

Dónde leer la nota oficial

Puedes ver la entrada oficial para detalles técnicos, imágenes y las guías de migración en la publicación de Google. Entrada oficial de Gemini 2.5. (deepmind.google)

Pensamiento final

Estas actualizaciones muestran una evolución práctica: más opciones de costo y latencia para distintos perfiles de uso, con Pro manteniendo el liderazgo en tareas complejas. Si desarrollas con Gemini, aprovecha el preview de Flash-Lite para evaluar reducción de costos, y planifica la migración según las fechas de deprecación para evitar interrupciones.

¡Mantente al día!

Recibe guías prácticas, hechos verificados y análisis de IA directo en tu correo, sin jerga técnica ni rodeos.

Tus datos están a salvo. Darse de baja es muy fácil en cualquier momento.