Google presenta Veo 2 e Imagen 3 para video e imagen IA

15 dic 20244 minutos

Google anuncia nuevas versiones de sus modelos generativos que buscan cerrar la brecha entre ideas y producción audiovisual. Veo 2 mejora la generación de video con mayor entendimiento de cinematografía y física realista, y Imagen 3 pule color, composición y estilos en imágenes. La nota original fue publicada por Google DeepMind el 16 de diciembre de 2024. (deepmind.google)

Veo 2: video con mirada de director

Veo 2 es la nueva versión del generador de video de Google DeepMind. Según su presentación, produce videos en alta calidad, entiende movimiento humano y física mejor que versiones anteriores, y responde a indicaciones propias del cine, como tipo de lente y efectos de cámara. Puede generar hasta resolución 4K y trabaja con clips que se extienden a minutos. (deepmind.google)

Preguntas prácticas: quieres un plano cenital, un primer plano con poca profundidad de campo o un seguimiento lateral a baja altura - Solo escríbelo en el prompt y Veo 2 tratará de respetarlo. Usos inmediatos: fondos para Shorts, demostraciones de producto, storyboards para cine o prototipos publicitarios. (deepmind.google)

Dato técnico útil

Si en tu prompt indicas 18mm lens o pides shallow depth of field, el modelo interpreta esas convenciones de cinematografía y ajusta la composición y el campo visual en consecuencia. Esto es ideal para quien ya trabaja con lenguaje audiovisual y quiere controlar estilo sin editar fotograma por fotograma. (deepmind.google)

Imagen 3: imágenes más brillantes y fieles al prompt

Imagen 3 llega con mejoras en brillo, composición y variedad de estilos artísticos. Según Google, ahora sigue mejor las instrucciones y representa texturas y detalles más ricos, desde fotorealismo hasta estilos como impresionismo o anime. La actualización se implementa en ImageFX y se desplegará en más de 100 países. (deepmind.google)

Esto significa que, para creadores y equipos de diseño, los prompts podrán producir resultados más cercanos a la intención original sin tantas iteraciones. Un ejemplo concreto: pedir una escena tipo estacion de tren al amanecer con luz difusa y obtener mejor manejo de la iluminación y la composición. (deepmind.google)

Whisk: mezcla imágenes y prompts para prototipar ideas

Whisk es el experimento nuevo de Google Labs que permite subir imágenes, que luego son descritas automáticamente por Gemini y reinyectadas a Imagen 3 para hacer remixes creativos. Es una herramienta pensada para prototipado rápido de productos visuales como pins, stickers o personajes digitales. Whisk se lanzó inicialmente en Estados Unidos. (deepmind.google)

Disponibilidad y medidas de seguridad

Las tecnologías están llegando primero a las herramientas de Google Labs: VideoFX, ImageFX y Whisk. Google también menciona planes para integrar Veo 2 en YouTube Shorts y en Vertex AI para clientes empresariales. Para mitigar malusos, las imágenes y videos generados incluyen una marca de agua invisible llamada SynthID para ayudar a identificar contenidos creados por IA. La expansión de acceso es gradual para evaluar calidad y seguridad. (deepmind.google)

¿Qué significa esto para ti, creador o emprendedor?

Si haces videos para redes, esto acelera la creación de ideas visuales sin alquilar equipos costosos. Piensa en prototipos visuales que antes requerían set y postproducción.
Si diseñas productos o materiales de marketing, Imagen 3 y Whisk permiten iterar estilos visuales más rápido y con menos intermediarios.
Para empresas, la integración con Vertex AI sugiere flujos de trabajo más profesionales y controlables a escala. (deepmind.google)

Consejos prácticos para usar estas herramientas hoy

Escribe prompts que incluyan estilo, lente, y emoción: por ejemplo, especifica wide angle 18mm, golden hour y warm color grading para resultados más coherentes.
Revisa la marca SynthID y los metadatos si vas a publicar en canales donde la procedencia importa.
Usa estas herramientas para iterar ideas, no como solución final automática; la revisión humana sigue siendo clave para coherencia narrativa y derechos.

Riesgos y preguntas abiertas

La mejora en realismo reduce algunos errores típicos como manos extra o artefactos, pero no los elimina por completo. Hay riesgos de desinformacion y de uso no autorizado de estilos o identidades. Google declara un despliegue gradual y controles de seguridad, pero es prudente mantener procesos de verificacion y ética en tu flujo creativo. (deepmind.google)

Para probar las herramientas visita Google Labs: VideoFX, ImageFX y Whisk. Si trabajas con contenido sensible o comercial, considera integrar revisiones humanas y controles legales antes de publicar. (deepmind.google)

La inteligencia artificial avanza rápido, pero su utilidad real aparece cuando la combinas con criterio humano. ¿Qué proyecto podrías prototipar hoy si no necesitaras un set de filmacion completo?

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.