Modelos

Google I/O 2026: Gemini Omni entiende física real, 900 millones de usuarios y el TPU 8 que dobla la eficiencia energética

Hassabis presentó Gemini Omni, que genera cualquier output desde cualquier input y simula física real. Pichai reveló 900 millones de usuarios en la app de Gemini y 9,7 billones de tokens procesados al mes.

G
Gonzalo· Fundador
· 4 min de lectura
Google IO

Sundar Pichai abrió el Google I/O 2026 en el Shoreline Amphitheatre de Mountain View con un número que no necesitaba contexto: 900 millones de usuarios activos en la app de Gemini, el doble que hace un año. Y 9,7 billones de tokens procesados al mes. Antes de que nadie anunciara nada, los datos de adopción ya decían que algo había cambiado en el ecosistema Google.

Lo que vino después fue la presentación más ambiciosa de modelos que Google ha hecho en años.

Demis Hassabis, CEO y cofundador de Google DeepMind, subió al escenario para anunciar Gemini Omni, un nuevo modelo que puede crear cualquier output desde cualquier input. Combina la inteligencia de Gemini con la multimodalidad: puedes alimentarlo con audio, vídeo, imágenes y texto para generar vídeo. Es muy preciso simulando física y gravedad, y puede traducir prompts complejos en vídeos muy precisos. MarTech Series

El anuncio de Gemini Omni generó una gran reacción del público. Puede entender física para interacciones más realistas de materiales y personajes. Hassabis señaló que entender la gravedad es una función avanzada para la IA. MarTech Series

Gemini Omni: qué lo hace diferente a Veo y a los generadores de vídeo actuales

La distinción que Hassabis subrayó en el escenario no es de calidad visual sino de comprensión física. Los generadores de vídeo actuales — incluyendo el propio Veo 3 de Google — producen imágenes que parecen físicamente plausibles. Gemini Omni está diseñado para producir simulaciones que respetan las leyes físicas del entorno que modelan.

El primer modelo de la familia, Gemini Omni Flash, llega este verano. Hassabis afirmó que a largo plazo, Omni podrá generar cualquier output desde cualquier input. Las capacidades multimodales del modelo son su característica más intrigante según los periodistas presentes en el escenario. GlobeNewswire

La referencia de Hassabis a los modelos de mundo en su presentación no es casual. Es la misma dirección estratégica que Runway anunció la semana pasada y que Google DeepMind lleva años investigando. La física simulada correctamente es lo que separa un generador de contenido visual de un simulador de entornos reales útil para robótica, ciencia y entrenamiento de agentes.

Hassabis también repitió en el escenario su predicción habitual: que la inteligencia artificial general está a pocos años. Es una afirmación que hace en cada I/O desde 2023. Esta vez llegó acompañada de un modelo que, al menos en las demos de escenario, muestra comportamientos que ningún sistema anterior de Google había exhibido con la misma fluidez.

El TPU 8 y la infraestructura que lo hace posible

Google presentó el TPU 8, su nuevo chip de procesamiento, con hasta el doble de rendimiento por vatio respecto a la generación anterior. El vídeo de presentación con ojos de caricatura fue bien recibido por el público. BrightEdge

El doble de rendimiento por vatio no es un número abstracto. En un contexto donde los centros de datos de IA consumen cantidades récord de energía y el debate sobre la huella ambiental de los modelos de IA es cada vez más visible, mejorar la eficiencia energética por unidad de cómputo es tanto una ventaja competitiva como una respuesta a una crítica estructural.

Google también reveló una asociación con Blackstone respaldada por 5.000 millones para expandir el acceso a los chips TPU y la infraestructura de IA de Google, con el objetivo de desafiar el dominio de Nvidia. El acuerdo con Blackstone, sumado al TPU 8, es la respuesta de Google a la pregunta que los analistas llevan meses haciendo: si puede reducir su dependencia de las GPU de Nvidia para sus propias cargas de trabajo y para las de sus clientes en Cloud. GlobeNewswire

Docs Live y Ask YouTube: la IA integrada en el trabajo diario

Más allá de los modelos, el I/O trajo dos actualizaciones de producto que afectan directamente a cómo millones de personas trabajan cada día.

Docs Live llega a suscriptores Pro y Ultra este verano y permitirá crear y editar documentos usando solo la voz gracias a Gemini. La función permite hacer un «volcado mental» de ideas en lenguaje natural, y Gemini lo organiza automáticamente. Las mismas capacidades llegarán pronto a otras aplicaciones de Google. BrightEdge

Google presentó Ask YouTube, una nueva función que encuentra vídeos de forma inteligente con ayuda de la IA. En lugar de buscar por palabras clave, el usuario hace una pregunta y el sistema encuentra clips relevantes y directos a la respuesta. OpenAI usará la verificación de contenido de Google para detectar contenido generado por IA, junto a otros partners. GlobeNewswire

El I/O de hoy continúa con la keynote de desarrolladores a la 1 p.m. PT. Las sesiones técnicas y las demos en manos de periodistas en los próximos días revelarán cuánto de lo que Hassabis mostró en el escenario se traduce en experiencia real fuera de las condiciones controladas de una presentación.

Fuentes

EtiquetasGeminiGoogle DeepMindMultimodalInferencia IA

Seguir leyendo