Gemini Omni Flash: de un prompt a imagen y vídeo para redes
Google ya deja crear una imagen en cuatro segundos y animarla en vídeo describiéndola en una frase. Cómo producir contenido para redes desde la app, cuánto cuesta y qué límites tiene todavía en preview.


Una tienda de aceite de un pueblo de Jaén quiere un Reel para Instagram: su botella sobre una mesa de madera, luz de atardecer, la cámara acercándose despacio. Hasta hace un mes eso eran dos opciones: pagar a alguien que lo grabara y editara, o pasarse una tarde peleándose con el móvil y una app de edición.
Desde ayer hay una tercera. Describes la escena en una frase, obtienes la imagen en cuatro segundos, le pides que la anime y en menos de un minuto tienes un clip de diez segundos listo para subir. Todo desde la app, sin cámara y sin editar.
La pieza que lo hace posible se llama Gemini Omni Flash, y esta guía explica cómo llevar una idea de una frase a un vídeo publicable, qué plan necesitas, cuánto cuesta de verdad y —lo más importante para un negocio— qué límites y qué reglas legales tienes que conocer antes de darle a publicar.
Qué es Gemini Omni Flash y por qué el lanzamiento de ayer cambia el cálculo para una pyme
Conviene separar dos nombres. Gemini Omni es la familia de modelos generativos de Google, presentada en el Google I/O del 19 de mayo de 2026. Gemini Omni Flash es el primer modelo de esa familia: crea y edita vídeo a partir de cualquier combinación de texto, imagen, audio y vídeo, y devuelve vídeo de alta resolución con sonido. La palabra «Flash» significa lo de siempre en la nomenclatura de Google: rápido y barato frente a los modelos más pesados.
Lo que cambió el 30 de junio de 2026 no fue el modelo en sí, sino su precio y su acceso. Ese día Google abrió Omni Flash a desarrolladores en preview y, a la vez, lanzó Nano Banana 2 Lite, su modelo de imagen más rápido: unos cuatro segundos por imagen. Juntos forman un flujo de dos pasos que es justo lo que necesita quien produce contenido para redes.
La otra novedad de Omni Flash es la edición conversacional. En lugar de escribir un prompt gigante y rezar, hablas con el modelo: «cambia la luz a más cálida», «que la cámara suba en vez de acercarse», «quita la etiqueta de la botella». Cada cambio se apoya en el anterior y el modelo intenta mantener la escena y los objetos estables entre versiones. Es el mismo salto que dio la edición de imágenes con Nano Banana, ahora aplicado al vídeo.
El flujo real: de una frase a un clip publicable en cuatro pasos
Para una pyme, la vía interesante no es la API —eso es para quien programa— sino la app. Omni Flash está en la app de Gemini y en Google Flow, el estudio creativo de Google, y también gratis en YouTube Shorts y YouTube Create. El proceso, en la práctica, es este.
El cuello de botella de siempre en el contenido de una pyme es el volumen: diez variantes de un anuncio, versiones para cada producto, adaptaciones por temporada. Con una imagen a cuatro segundos y un vídeo a diez, producir diez variantes deja de ser un proyecto y pasa a ser un rato. Ese, y no el efecto sorpresa, es el cambio real.
Qué plan necesitas y cuánto cuesta de verdad
Aquí hay que ser claro porque la comunicación de Google mezcla superficies. El plan gratuito de Gemini no genera vídeo. Para llegar a Omni Flash tienes varias puertas, con precios muy distintos.
Dos apuntes sobre esa tabla. En la API, el vídeo cuesta 0,10 $ por segundo (lo mismo que Veo 3.1 Fash) y la imagen de Nano Banana 2 Lite, 0,034 $ por imagen a 1K: un clip de diez segundos ronda 1 $ de generación. Y los planes de pago ya no van por «prompts al día», sino por un sistema de uso que se recarga cada cinco horas hasta un tope semanal, así que la generación de vídeo, que es cara en cómputo, agota el cupo más rápido que un chat normal.
Un prompt bueno frente a uno malo para vídeo de producto
El modelo es tan bueno como lo que le pides. El error más común es tratarlo como un buscador: cuatro palabras y a ver qué sale. Para vídeo de producto, lo que marca la diferencia es especificar sujeto, superficie, luz, movimiento de cámara y estilo. Compara.
El segundo prompt le da al modelo lo que necesita para decidir: encuadre, iluminación, ritmo, duración y qué evitar. Fíjate en dos detalles útiles. Indicar la duración («en 8 segundos») ayuda a controlar el ritmo dentro del corte de diez. Y decir explícitamente «sin texto» evita uno de los puntos débiles del modelo, que trataremos ahora.
Lo que todavía no funciona: los límites del preview que te ahorran un disgusto
Omni Flash está en preview, y eso no es una formalidad. Hay cosas que a fecha de hoy no hace o hace mal, y conviene saberlas antes de montar tu calendario de publicaciones sobre esta herramienta.
Hay un límite más que afecta al sonido: la edición de voz —cambiar lo que dice una persona en un vídeo existente— está retenida mientras Google estudia cómo desplegarla con garantías. En resumen: úsalo para prototipar y para piezas cortas de producto o ambiente, no para montar tu anuncio anual sin revisarlo. Es una herramienta con la que jugar, no todavía una sobre la que construir a ciegas.
SynthID, marcas y caras: lo que un negocio en España debe saber antes de publicar
Esta es la parte que casi ningún tutorial cuenta y que a un negocio le puede costar un disgusto. Generar el vídeo es lo fácil; publicarlo con cabeza es lo que importa.
Lo primero: todo lo que sale de Omni lleva marca de agua. Google incrusta SynthID, invisible al ojo, y credenciales de contenido C2PA en cada clip. Se puede verificar que un vídeo se hizo con Gemini desde la propia app. Traducido a tu negocio: no vas a poder hacer pasar el vídeo por una grabación real sin dejar rastro, y las plataformas cada vez detectan y etiquetan mejor este contenido. Juega con transparencia.
Omni Flash bloquea la generación de personas reales por su nombre o parecido: si lo intentas, devuelve un aviso de contenido no permitido. Si quieres que aparezca una persona, tienes que crear tu propio avatar digital dentro de la herramienta. No sirve para «poner» a un famoso, a un competidor o a un cliente en tu vídeo, y hacerlo por otras vías tendría además problemas legales de derechos de imagen.
Segundo aviso, sobre propiedad intelectual. Que el modelo sea capaz de producir algo parecido a un personaje conocido no significa que puedas publicarlo. Los derechos de autor, las marcas registradas, la música y los derechos de imagen siguen aplicando igual que siempre. Para una pyme la regla práctica es simple: genera cosas tuyas —tu producto, tu local, escenas genéricas— y no intentes acercarte a IP ajena aunque el modelo te deje.
Y un matiz europeo que va a más. En la UE, por el AI Act y el RGPD, Google aplica filtros más estrictos que en otros mercados, y algunas funciones creativas llegan más tarde o recortadas. El marco regulatorio sigue moviéndose durante 2026, así que la disponibilidad exacta de funciones en España puede cambiar de un mes a otro. No es motivo para no usarlo; sí para no dar por hecho que lo que viste en un vídeo de demo estadounidense estará disponible igual aquí.
Empieza gratis esta semana. Abre YouTube Shorts o paga los 7,99 € de AI Plus, coge un producto real y haz el recorrido completo: imagen, animación, un par de correcciones habladas y exportar. En media hora sabrás si el corte de diez segundos y los fallos del preview te sirven o te frenan; si te frenan, la señal es esperar a que la herramienta madure o a que llegue el modelo Omni de gama alta. La ventaja de fondo no es el juguete, es el coste por pieza: cuando producir diez variantes de un anuncio cuesta un rato en vez de una tarde, la pregunta deja de ser «¿puedo permitirme un vídeo?» y pasa a ser otra, más incómoda: si todo tu sector va a producir a este ritmo, ¿qué hace que el tuyo destaque?
Fuentes
Seguir leyendo

Conecta la IA a Gmail, Calendar y Sheets con MCP sin programar
Claude ya lee tu correo, gestiona tu agenda y abre tus hojas de cálculo con un par de clics. Te explicamos qué conector activar, qué hace cada uno y dónde el «sin programar» deja de ser cierto.

Navegadores con IA en modo agente: guía práctica para tareas reales de oficina con Atlas, Comet y Claude en Chrome
Atlas, Comet y Claude en Chrome ejecutan tareas en tu navegador de forma autónoma. Esta guía explica qué puede hacer cada uno en entornos de oficina reales, cuál elegir y qué límites tienes que conocer antes de delegar.

ChatGPT privado con gpt-oss en local: cero datos fuera, cero suscripción, cumplimiento del AI Act
gpt-oss: el primer modelo open-weight de OpenAI, Apache 2.0, cero datos fuera. Esta guía explica cómo montarlo en una tarde, qué obligaciones del AI Act cubre y cuándo tiene más sentido que la API de OpenAI.