Gemini 3.5 Flash confirma disponibilidad general hoy: el modelo ya estable para producción en todos los planes de Google
Google confirma hoy la disponibilidad general de Gemini 3.5 Flash en la API, AI Studio y Antigravity. El modelo que ya usa por defecto 900 millones de personas es ahora estable para entornos de producción enterprise.

El 19 de mayo, en el Google I/O, Sundar Pichai presentó Gemini 3.5 Flash como el nuevo modelo por defecto para los 900 millones de usuarios activos de la app de Gemini y de Google Search AI Mode. Hoy, 1 de junio, Google confirma la disponibilidad general del modelo en la API, Google AI Studio y Antigravity.
La distinción entre el lanzamiento del I/O y la disponibilidad general de hoy es técnicamente importante para los equipos de desarrollo. Durante las dos semanas entre el 19 de mayo y hoy, el modelo estaba accesible en preview — los desarrolladores podían probarlo y evaluar su comportamiento, pero sin las garantías de estabilidad de API, los acuerdos de nivel de servicio y los compromisos de pricing a largo plazo que los entornos de producción requieren.
La disponibilidad general cierra esa brecha. A partir de hoy, Gemini 3.5 Flash tiene los compromisos operacionales que los clientes enterprise necesitan para integrar el modelo en sistemas que procesan trabajo real.
Los números que justifican la migración a producción
Los benchmarks de Gemini 3.5 Flash son los que ya publicamos cuando cubrimos el lanzamiento del I/O, pero conviene repetirlos en el contexto de la disponibilidad general porque son los números sobre los que los equipos van a tomar decisiones de migración esta semana.
Terminal-Bench 2.1 (codificación agéntica): 76,2%. MCP Atlas (uso de herramientas a escala): 83,6%. GDPval-AA (tareas agénticas reales): 1.656 Elo, frente a 1.317 de Gemini 3.1 Pro en su lanzamiento. MMMU-Pro (comprensión multimodal): 84,2%.
El GDPval-AA es el número más relevante para equipos enterprise que construyen agentes: es el benchmark que mide rendimiento en tareas agénticas reales, no en condiciones de laboratorio. Un salto de 1.317 a 1.656 en ese benchmark en tres meses no es una mejora incremental — es un cambio de categoría en lo que el modelo puede hacer de forma autónoma en entornos de producción.
El precio se mantiene en 1,50 dólares por millón de tokens de entrada y 9 dólares por millón de tokens de salida, con ventana de contexto de 1 millón de tokens. Comparado con Gemini 3.1 Pro que venía cobrando más por menos rendimiento en los benchmarks que más importan para agentes y código, el argumento para migrar es directo.
Qué cambia en la API y qué hay que actualizar
El changelog de Google publicado hoy incluye dos cambios técnicos que los equipos que usan la API necesitan procesar antes de migrar.
El primero: la Interactions API cambió su schema el 26 de mayo. El schema legacy se elimina el 8 de junio. Los equipos que todavía no han migrado tienen una semana.
El segundo: Gemini 3.5 Flash introduce una nueva capacidad nativa de generación de código con verificación de ejecución integrada. El modelo puede generar código, ejecutarlo en un sandbox, verificar los resultados y corregir los errores en el mismo flujo de trabajo, sin llamadas adicionales a la API. Para los equipos que construyen agentes de codificación, eso elimina la necesidad de gestionar la lógica de verificación y corrección en el lado del cliente.
El contexto competitivo en disponibilidad general
Con Gemini 3.5 Flash en GA, el mercado tiene ahora tres modelos de gama media-alta en disponibilidad general simultáneamente que compiten directamente: Claude Sonnet 4.6 de Anthropic, GPT-5.5 Instant de OpenAI y Gemini 3.5 Flash de Google.
La decisión de qué modelo usar en producción en junio de 2026 ya no es una apuesta sobre quién va a ganar la carrera frontier. Es una decisión de ingeniería sobre qué combinación de precio, velocidad, contexto y capacidades específicas encaja mejor con el caso de uso concreto.
Gemini 3.5 Flash gana en velocidad de generación de tokens, en multimodalidad nativa y en contexto de 1 millón de tokens. Claude Sonnet gana en calidad de escritura y en codificación compleja con múltiples archivos. GPT-5.5 Instant gana en integración con el ecosistema de herramientas de OpenAI y en acceso a búsqueda web nativa.
Para los equipos que viven en el ecosistema Google — usando Firebase, Google Cloud, Android o Workspace — Gemini 3.5 Flash en GA es la opción natural por integración nativa. Para el resto, la decisión depende del caso de uso específico más que de la calidad absoluta del modelo.
Gemini 3.5 Pro: la pregunta que sigue abierta
La disponibilidad general de Flash no resuelve la pregunta que más expectativa generó en el I/O. Gemini 3.5 Pro, el modelo que Google describió como el verdadero sucesor del flagship con rendimiento de nivel máximo, sigue sin fecha de disponibilidad general confirmada más allá de «próximamente en junio».
Para los equipos que esperan el Pro para evaluar si Google puede competir con Claude Opus 4.8 y GPT-5.5 en el segmento de máxima capacidad, la espera continúa. Flash en GA es la confirmación de que Google puede competir en velocidad y precio con calidad muy sólida en benchmarks de agentes. Pro es la apuesta de que también puede competir en capacidad bruta para las tareas más complejas. Esa apuesta todavía no está disponible para evaluación en producción.
Fuentes
Seguir leyendo
NuevoMicrosoft lanzó sus propios modelos de IA en el Build: compite directamente con OpenAI y Anthropic mientras los financia
En el Microsoft Build 2026, Satya Nadella presentó siete nuevos modelos MAI propios y Microsoft IQ en disponibilidad general. La empresa que invirtió 13.000 millones en OpenAI lanza ahora su alternativa directa.

Anthropic lanza Claude Opus 4.8 hoy: cuatro veces menos errores en código y mayor honestidad sobre sus propios fallos
Apenas seis semanas después de Opus 4.7, Anthropic lanza Opus 4.8 al mismo precio con mejoras en codificación agéntica, fiabilidad y alineación. Es cuatro veces menos probable que ignore errores en el código que genera.

OpenAI admitió que el modo de voz de ChatGPT corre en un modelo más débil del que anunció — y los desarrolladores lo detectaron antes
Una controversia estalló esta semana cuando desarrolladores probaron que la voz de ChatGPT no usa GPT-5.5 sino un modelo interno más pequeño. OpenAI reconoció la discrepancia y actualizó su documentación.