Gemini 3.5 Flash confirma disponibilidad general hoy: el modelo ya estable para producción en todos los planes de Google

Google confirma hoy la disponibilidad general de Gemini 3.5 Flash en la API, AI Studio y Antigravity. El modelo que ya usa por defecto 900 millones de personas es ahora estable para entornos de producción enterprise.

Gonzalo· Fundador

1 de junio de 2026 · 4 min de lectura

Asistido por IA · revisado por el editor

El 19 de mayo, en el Google I/O, Sundar Pichai presentó Gemini 3.5 Flash como el nuevo modelo por defecto para los 900 millones de usuarios activos de la app de Gemini y de Google Search AI Mode. Hoy, 1 de junio, Google confirma la disponibilidad general del modelo en la API, Google AI Studio y Antigravity.

La distinción entre el lanzamiento del I/O y la disponibilidad general de hoy es técnicamente importante para los equipos de desarrollo. Durante las dos semanas entre el 19 de mayo y hoy, el modelo estaba accesible en preview — los desarrolladores podían probarlo y evaluar su comportamiento, pero sin las garantías de estabilidad de API, los acuerdos de nivel de servicio y los compromisos de pricing a largo plazo que los entornos de producción requieren.

La disponibilidad general cierra esa brecha. A partir de hoy, Gemini 3.5 Flash tiene los compromisos operacionales que los clientes enterprise necesitan para integrar el modelo en sistemas que procesan trabajo real.

Los números que justifican la migración a producción

Los benchmarks de Gemini 3.5 Flash son los que ya publicamos cuando cubrimos el lanzamiento del I/O, pero conviene repetirlos en el contexto de la disponibilidad general porque son los números sobre los que los equipos van a tomar decisiones de migración esta semana.

Terminal-Bench 2.1 (codificación agéntica): 76,2%. MCP Atlas (uso de herramientas a escala): 83,6%. GDPval-AA (tareas agénticas reales): 1.656 Elo, frente a 1.317 de Gemini 3.1 Pro en su lanzamiento. MMMU-Pro (comprensión multimodal): 84,2%.

El GDPval-AA es el número más relevante para equipos enterprise que construyen agentes: es el benchmark que mide rendimiento en tareas agénticas reales, no en condiciones de laboratorio. Un salto de 1.317 a 1.656 en ese benchmark en tres meses no es una mejora incremental — es un cambio de categoría en lo que el modelo puede hacer de forma autónoma en entornos de producción.

El precio se mantiene en 1,50 dólares por millón de tokens de entrada y 9 dólares por millón de tokens de salida, con ventana de contexto de 1 millón de tokens. Comparado con Gemini 3.1 Pro que venía cobrando más por menos rendimiento en los benchmarks que más importan para agentes y código, el argumento para migrar es directo.

Qué cambia en la API y qué hay que actualizar

El changelog de Google publicado hoy incluye dos cambios técnicos que los equipos que usan la API necesitan procesar antes de migrar.

El primero: la Interactions API cambió su schema el 26 de mayo. El schema legacy se elimina el 8 de junio. Los equipos que todavía no han migrado tienen una semana.

El segundo: Gemini 3.5 Flash introduce una nueva capacidad nativa de generación de código con verificación de ejecución integrada. El modelo puede generar código, ejecutarlo en un sandbox, verificar los resultados y corregir los errores en el mismo flujo de trabajo, sin llamadas adicionales a la API. Para los equipos que construyen agentes de codificación, eso elimina la necesidad de gestionar la lógica de verificación y corrección en el lado del cliente.

El contexto competitivo en disponibilidad general

Con Gemini 3.5 Flash en GA, el mercado tiene ahora tres modelos de gama media-alta en disponibilidad general simultáneamente que compiten directamente: Claude Sonnet 4.6 de Anthropic, GPT-5.5 Instant de OpenAI y Gemini 3.5 Flash de Google.

La decisión de qué modelo usar en producción en junio de 2026 ya no es una apuesta sobre quién va a ganar la carrera frontier. Es una decisión de ingeniería sobre qué combinación de precio, velocidad, contexto y capacidades específicas encaja mejor con el caso de uso concreto.

Gemini 3.5 Flash gana en velocidad de generación de tokens, en multimodalidad nativa y en contexto de 1 millón de tokens. Claude Sonnet gana en calidad de escritura y en codificación compleja con múltiples archivos. GPT-5.5 Instant gana en integración con el ecosistema de herramientas de OpenAI y en acceso a búsqueda web nativa.

Para los equipos que viven en el ecosistema Google — usando Firebase, Google Cloud, Android o Workspace — Gemini 3.5 Flash en GA es la opción natural por integración nativa. Para el resto, la decisión depende del caso de uso específico más que de la calidad absoluta del modelo.

Gemini 3.5 Pro: la pregunta que sigue abierta

La disponibilidad general de Flash no resuelve la pregunta que más expectativa generó en el I/O. Gemini 3.5 Pro, el modelo que Google describió como el verdadero sucesor del flagship con rendimiento de nivel máximo, sigue sin fecha de disponibilidad general confirmada más allá de «próximamente en junio».

Para los equipos que esperan el Pro para evaluar si Google puede competir con Claude Opus 4.8 y GPT-5.5 en el segmento de máxima capacidad, la espera continúa. Flash en GA es la confirmación de que Google puede competir en velocidad y precio con calidad muy sólida en benchmarks de agentes. Pro es la apuesta de que también puede competir en capacidad bruta para las tareas más complejas. Esa apuesta todavía no está disponible para evaluación en producción.

Fuentes

Enlaces a las fuentes originales en las que se apoya esta noticia. Contrasta cada dato en su origen.

Google AI Developer (changelog oficial)ai.google.dev
MarkTechPostmarktechpost.com
FelloAI (análisis completo)felloai.com

EtiquetasGemini Google DeepMind Benchmarks

En la elaboración de este artículo se ha utilizado inteligencia artificial como apoyo en la investigación y redacción. El contenido ha sido revisado editorialmente antes de su publicación.

GonzaloFundador

Madrileño enganchado a la tecnología desde pequeño. Trabajo en finanzas pero la inteligencia artificial es lo que me quita el sueño. Creé Miuranews para seguirla de cerca y contarla en español sin hype.

Todos sus artículos →

◈ Asistente Miuranews

Pregunta sobre este artículo

Respuestas basadas en esta pieza y en el archivo de Miuranews. Sin inventar: si no está cubierto, te lo dice.

Prueba una

Experimento en beta · No sustituye a la lectura del artículo