Modelos

Gemini 3.5 Flash sale de preview y entra en disponibilidad general: el modelo por defecto de 900 millones de usuarios ya es el definitivo

Google confirma la disponibilidad general de Gemini 3.5 Flash en la API, Google AI Studio y Antigravity. El modelo que ya usa por defecto la app de Gemini y Google Search AI Mode es ahora estable para producción.

G
Gonzalo· Fundador
· 3 min de lectura
Gemini

El anuncio del I/O del 19 de mayo presentó Gemini 3.5 Flash como el nuevo modelo por defecto de la app de Gemini y de Google Search AI Mode para los 900 millones de usuarios activos de la plataforma. Hoy, una semana después, Google confirma la disponibilidad general del modelo en la API, Google AI Studio y Antigravity. La diferencia no es cosmética: disponibilidad general significa que el modelo ha superado el período de preview, está listo para entornos de producción y tiene los compromisos de SLA que los clientes enterprise requieren antes de integrar un modelo en sus sistemas.

Gemini 3.5 Flash está disponible de forma general hoy. Inteligencia de nivel frontier a cuatro veces la velocidad de modelos comparables. 1,50 dólares por millón de tokens de entrada y 9 dólares por millón de tokens de salida. Ventana de contexto de 1 millón de tokens. 76,2% en Terminal-Bench 2.1. Supera a Gemini 3.1 Pro en codificación y agentes. Notion

Qué cambia con la disponibilidad general respecto al preview

Durante el período de preview que siguió al I/O, el modelo era accesible para desarrolladores que querían probarlo, pero sin las garantías de estabilidad de API, los acuerdos de nivel de servicio y los compromisos de pricing a largo plazo que los clientes enterprise necesitan. La disponibilidad general cierra esa brecha.

Para los equipos que llevan una semana evaluando Gemini 3.5 Flash para sus aplicaciones, la confirmación de GA es la señal para avanzar de la evaluación a la integración en producción. Para Google, es el cierre del ciclo que comenzó el 19 de mayo: el modelo está en todos los productos de consumo y ahora está disponible para que los desarrolladores construyan sobre él con garantías de producción.

La velocidad del ciclo — de anuncio en I/O a disponibilidad general en una semana — es también una señal sobre el ritmo al que Google está operando en el despliegue de modelos en 2026. El ciclo anterior, de Gemini 3.1 Pro a disponibilidad general, tardó varias semanas más. La compresión de ese ciclo refleja tanto la madurez de la infraestructura de despliegue de Google como la presión competitiva de un mercado donde Claude Sonnet y GPT-5.5 Instant ya tienen disponibilidad general desde hace semanas.

El contexto competitivo en disponibilidad general

Con Gemini 3.5 Flash en GA, el mercado tiene ahora tres modelos de gama media-alta en disponibilidad general simultáneamente: Claude Sonnet 4.6 de Anthropic, GPT-5.5 Instant de OpenAI y Gemini 3.5 Flash de Google. Los tres apuntan a casos de uso similares — agentes, codificación, análisis de documentos largos, uso diario en producción — con precios, velocidades y capacidades distintas.

La decisión de qué modelo usar en producción en 2026 ya no es una apuesta por el ganador de la carrera frontier. Es una decisión de ingeniería sobre qué combinación de precio, velocidad, contexto y capacidades específicas encaja mejor con el caso de uso concreto. Gemini 3.5 Flash gana en velocidad y en multimodalidad nativa. Claude Sonnet gana en calidad de escritura y en codificación compleja. GPT-5.5 Instant gana en integración con el ecosistema de OpenAI y en acceso a herramientas.

Gemini 3.5 Pro: lo que todavía falta

La disponibilidad general de Flash no resuelve la pregunta que más expectativa generó en el I/O. Gemini 3.5 Pro, el modelo que Google describió como el verdadero sucesor del flagship, sigue sin fecha de lanzamiento confirmada más allá de «junio». Que Flash en GA llegue esta semana sin noticias de Pro sugiere que el modelo flagship necesita más tiempo de evaluación interna antes de estar listo para producción general.

Para los equipos que esperaban el Pro para evaluar si Google puede competir con Claude Opus 4.7 y GPT-5.5 en el segmento de máxima capacidad, la espera continúa. Flash en GA es la confirmación de que Google puede competir en velocidad y precio. Pro es la apuesta de que también puede competir en capacidad bruta. Esa apuesta todavía no se ha podido evaluar en producción.

Fuentes

EtiquetasGeminiGoogle DeepMindInferencia IABenchmarks

Seguir leyendo