Herramientas

Gemini Omni Flash: de un prompt a imagen y vídeo para redes

Google ya deja crear una imagen en cuatro segundos y animarla en vídeo describiéndola en una frase. Cómo producir contenido para redes desde la app, cuánto cuesta y qué límites tiene todavía en preview.

Gonzalo
Gonzalo· Fundador
· 7 min de lectura
Omni

Una tienda de aceite de un pueblo de Jaén quiere un Reel para Instagram: su botella sobre una mesa de madera, luz de atardecer, la cámara acercándose despacio. Hasta hace un mes eso eran dos opciones: pagar a alguien que lo grabara y editara, o pasarse una tarde peleándose con el móvil y una app de edición.

Desde ayer hay una tercera. Describes la escena en una frase, obtienes la imagen en cuatro segundos, le pides que la anime y en menos de un minuto tienes un clip de diez segundos listo para subir. Todo desde la app, sin cámara y sin editar.

La pieza que lo hace posible se llama Gemini Omni Flash, y esta guía explica cómo llevar una idea de una frase a un vídeo publicable, qué plan necesitas, cuánto cuesta de verdad y —lo más importante para un negocio— qué límites y qué reglas legales tienes que conocer antes de darle a publicar.

Qué es Gemini Omni Flash y por qué el lanzamiento de ayer cambia el cálculo para una pyme

Conviene separar dos nombres. Gemini Omni es la familia de modelos generativos de Google, presentada en el Google I/O del 19 de mayo de 2026. Gemini Omni Flash es el primer modelo de esa familia: crea y edita vídeo a partir de cualquier combinación de texto, imagen, audio y vídeo, y devuelve vídeo de alta resolución con sonido. La palabra «Flash» significa lo de siempre en la nomenclatura de Google: rápido y barato frente a los modelos más pesados.

Lo que cambió el 30 de junio de 2026 no fue el modelo en sí, sino su precio y su acceso. Ese día Google abrió Omni Flash a desarrolladores en preview y, a la vez, lanzó Nano Banana 2 Lite, su modelo de imagen más rápido: unos cuatro segundos por imagen. Juntos forman un flujo de dos pasos que es justo lo que necesita quien produce contenido para redes.

1 · Nano Banana 2 Lite
Escribes la escena y genera la imagen fija en unos 4 segundos. Es el «boceto» del que partirá el vídeo.
2 · Gemini Omni Flash
Le pasas esa imagen como referencia y la animas: movimiento de cámara, luz, acción. Devuelve un clip con sonido.
3 · Publicas
Reel, Short o TikTok. Sin cámara, sin editor de vídeo y sin salir de la app.

La otra novedad de Omni Flash es la edición conversacional. En lugar de escribir un prompt gigante y rezar, hablas con el modelo: «cambia la luz a más cálida», «que la cámara suba en vez de acercarse», «quita la etiqueta de la botella». Cada cambio se apoya en el anterior y el modelo intenta mantener la escena y los objetos estables entre versiones. Es el mismo salto que dio la edición de imágenes con Nano Banana, ahora aplicado al vídeo.

El flujo real: de una frase a un clip publicable en cuatro pasos

Para una pyme, la vía interesante no es la API —eso es para quien programa— sino la app. Omni Flash está en la app de Gemini y en Google Flow, el estudio creativo de Google, y también gratis en YouTube Shorts y YouTube Create. El proceso, en la práctica, es este.

1
Describe la imagen con detalle
Producto, superficie, luz, ángulo y estilo. Cuanto más concreto, menos lotería. Puedes subir una foto real de tu producto como referencia.
2
Ajusta la imagen hablando
«Más cálido», «fondo más limpio», «acerca el producto». Itera hasta que el fotograma de partida te convenza.
3
Anímala con Omni Flash
Describe el movimiento: «la cámara se acerca despacio mientras cae una gota de aceite». Genera un clip de hasta 10 segundos.
4
Corrige y exporta
Retoca lo que falle con más instrucciones en el chat y descarga el vídeo. Lo subes a tu red como cualquier otro.

El cuello de botella de siempre en el contenido de una pyme es el volumen: diez variantes de un anuncio, versiones para cada producto, adaptaciones por temporada. Con una imagen a cuatro segundos y un vídeo a diez, producir diez variantes deja de ser un proyecto y pasa a ser un rato. Ese, y no el efecto sorpresa, es el cambio real.

Qué plan necesitas y cuánto cuesta de verdad

Aquí hay que ser claro porque la comunicación de Google mezcla superficies. El plan gratuito de Gemini no genera vídeo. Para llegar a Omni Flash tienes varias puertas, con precios muy distintos.

Vía Precio Acceso a Omni Flash
YouTube Shorts / Create Gratis (+18) Sí, dentro de esas apps
Google AI Plus 7,99 €/mes (España, IVA incl.) Sí, acceso limitado
Google AI Pro 19,99 $/mes Sí, más holgado
Google AI Ultra Desde 99,99 $/mes Sí, límites altos
API / AI Studio 0,10 $ por segundo de vídeo Solo si programas

Dos apuntes sobre esa tabla. En la API, el vídeo cuesta 0,10 $ por segundo (lo mismo que Veo 3.1 Fash) y la imagen de Nano Banana 2 Lite, 0,034 $ por imagen a 1K: un clip de diez segundos ronda 1 $ de generación. Y los planes de pago ya no van por «prompts al día», sino por un sistema de uso que se recarga cada cinco horas hasta un tope semanal, así que la generación de vídeo, que es cara en cómputo, agota el cupo más rápido que un chat normal.

Un prompt bueno frente a uno malo para vídeo de producto

El modelo es tan bueno como lo que le pides. El error más común es tratarlo como un buscador: cuatro palabras y a ver qué sale. Para vídeo de producto, lo que marca la diferencia es especificar sujeto, superficie, luz, movimiento de cámara y estilo. Compara.

Prompt flojo
«Un vídeo de mi botella de aceite bonito para Instagram»
Prompt que funciona
«Botella de aceite de oliva verde sobre mesa de madera rústica, luz cálida de atardecer entrando de lado. La cámara se acerca despacio en 8 segundos mientras una gota resbala por el cristal. Estilo gastronómico, fondo desenfocado, sin texto»

El segundo prompt le da al modelo lo que necesita para decidir: encuadre, iluminación, ritmo, duración y qué evitar. Fíjate en dos detalles útiles. Indicar la duración («en 8 segundos») ayuda a controlar el ritmo dentro del corte de diez. Y decir explícitamente «sin texto» evita uno de los puntos débiles del modelo, que trataremos ahora.

Lo que todavía no funciona: los límites del preview que te ahorran un disgusto

Omni Flash está en preview, y eso no es una formalidad. Hay cosas que a fecha de hoy no hace o hace mal, y conviene saberlas antes de montar tu calendario de publicaciones sobre esta herramienta.

Máximo 10 segundos
Cada clip se corta ahí. Para un Reel más largo, tendrás que encadenar varios a mano.
Texto poco fiable
Rótulos, precios o el nombre de tu marca salen deformados. No delegues el texto en el modelo.
Consistencia irregular
Al cambiar de plano o al mover mucho la cámara, objetos y caras pueden variar.
Referencias limitadas
En la API todavía no admite subir audio de referencia, y los vídeos de referencia aún no se procesan bien.

Hay un límite más que afecta al sonido: la edición de voz —cambiar lo que dice una persona en un vídeo existente— está retenida mientras Google estudia cómo desplegarla con garantías. En resumen: úsalo para prototipar y para piezas cortas de producto o ambiente, no para montar tu anuncio anual sin revisarlo. Es una herramienta con la que jugar, no todavía una sobre la que construir a ciegas.

SynthID, marcas y caras: lo que un negocio en España debe saber antes de publicar

Esta es la parte que casi ningún tutorial cuenta y que a un negocio le puede costar un disgusto. Generar el vídeo es lo fácil; publicarlo con cabeza es lo que importa.

Lo primero: todo lo que sale de Omni lleva marca de agua. Google incrusta SynthID, invisible al ojo, y credenciales de contenido C2PA en cada clip. Se puede verificar que un vídeo se hizo con Gemini desde la propia app. Traducido a tu negocio: no vas a poder hacer pasar el vídeo por una grabación real sin dejar rastro, y las plataformas cada vez detectan y etiquetan mejor este contenido. Juega con transparencia.

Omni Flash bloquea la generación de personas reales por su nombre o parecido: si lo intentas, devuelve un aviso de contenido no permitido. Si quieres que aparezca una persona, tienes que crear tu propio avatar digital dentro de la herramienta. No sirve para «poner» a un famoso, a un competidor o a un cliente en tu vídeo, y hacerlo por otras vías tendría además problemas legales de derechos de imagen.

Segundo aviso, sobre propiedad intelectual. Que el modelo sea capaz de producir algo parecido a un personaje conocido no significa que puedas publicarlo. Los derechos de autor, las marcas registradas, la música y los derechos de imagen siguen aplicando igual que siempre. Para una pyme la regla práctica es simple: genera cosas tuyas —tu producto, tu local, escenas genéricas— y no intentes acercarte a IP ajena aunque el modelo te deje.

Y un matiz europeo que va a más. En la UE, por el AI Act y el RGPD, Google aplica filtros más estrictos que en otros mercados, y algunas funciones creativas llegan más tarde o recortadas. El marco regulatorio sigue moviéndose durante 2026, así que la disponibilidad exacta de funciones en España puede cambiar de un mes a otro. No es motivo para no usarlo; sí para no dar por hecho que lo que viste en un vídeo de demo estadounidense estará disponible igual aquí.

Empieza gratis esta semana. Abre YouTube Shorts o paga los 7,99 € de AI Plus, coge un producto real y haz el recorrido completo: imagen, animación, un par de correcciones habladas y exportar. En media hora sabrás si el corte de diez segundos y los fallos del preview te sirven o te frenan; si te frenan, la señal es esperar a que la herramienta madure o a que llegue el modelo Omni de gama alta. La ventaja de fondo no es el juguete, es el coste por pieza: cuando producir diez variantes de un anuncio cuesta un rato en vez de una tarde, la pregunta deja de ser «¿puedo permitirme un vídeo?» y pasa a ser otra, más incómoda: si todo tu sector va a producir a este ritmo, ¿qué hace que el tuyo destaque?

Fuentes

EtiquetasGeminiGoogle DeepMind

Seguir leyendo