Gemini 3.5 Flash supera al antiguo Pro de Google siendo cuatro veces más rápido y un 40% más barato
Google lanzó ayer en el I/O su primer modelo de la familia 3.5. Supera a Gemini 3.1 Pro en codificación y agentes, cuesta 1,50 dólares por millón de tokens y ya es el modelo por defecto en la app y en Google Search.

Hay un dato en el lanzamiento de Gemini 3.5 Flash que resume lo que está pasando en el mercado de modelos de IA mejor que cualquier benchmark: el modelo de la gama Flash, históricamente más barato y más ligero, ahora supera al modelo Pro de la generación anterior en las pruebas que más importan para agentes y código. Lo más económico se ha vuelto más capaz que lo que era la cima.
Gemini 3.5 Flash es el primer modelo de la nueva familia Gemini 3.5. Supera a Gemini 3.1 Pro en Terminal-Bench 2.1 (76.2%), MCP Atlas (83.6%) y GDPval-AA (1.656 Elo), corre aproximadamente cuatro veces más rápido en tokens de salida por segundo, y cuesta aproximadamente un 40% menos. Ya es el modelo por defecto en la app de Gemini y en AI Mode de Google Search para miles de millones de personas en todo el mundo. Business Today
El público en el Shoreline Amphitheatre recibió con un gemido colectivo la noticia de que Gemini 3.5 Pro, el verdadero sucesor del modelo flagship, llega en junio. Que el modelo que sí llegó ayer ya supere al Pro anterior es el dato que convierte ese gemido en algo más matizado.
Los benchmarks en contexto: dónde gana y dónde pierde
Los números de Google son sólidos en las pruebas que más importan para el mercado enterprise en 2026. El GDPval-AA, que mide rendimiento en tareas agénticas del mundo real, es el más revelador: Gemini 3.1 Pro puntuó 1.317 cuando se lanzó. Gemini 3.5 Flash puntúa 1.656. No es una mejora incremental — es un salto de categoría.
Contra el campo más amplio, el panorama es competitivo más que dominante. A mayo de 2026, GPT-5.5 lidera muchos benchmarks de flujos de trabajo agénticos, y Claude Opus 4.7 lidera varios benchmarks de codificación como SWE-bench Verified con la tasa de alucinación más baja de los tres. La ventaja de Gemini es velocidad y precio a calidad casi-flagship. Business Today
En benchmarks comparativos directos con competidores: Terminal-bench 2.1 (codificación), Gemini 3.5 Flash puntúa 76.2% frente al 78.2% de GPT-5.5 y el 66.1% de Claude Opus 4.7. En GDPval-AA (agéntico), 1.656 frente a 1.769 de GPT-5.5 y 1.753 de Claude Opus 4.7. En MMMU-Pro (multimodal), 83.6% frente a 81.2% de GPT-5.5 y 75.2% de Claude Opus 4.7. GlobeNewswire
El patrón que emerge: Gemini 3.5 Flash gana en multimodal y en velocidad, pierde en razonamiento puro y en codificación compleja. Para agentes que necesitan procesar texto, imagen, vídeo y audio simultáneamente a alta velocidad y bajo coste, el caso es convincente. Para debugging complejo de código o razonamiento matemático profundo, Claude y GPT-5.5 siguen siendo mejores opciones.
El precio que redefine la gama media del mercado
Gemini 3.5 Flash cuesta 1,50 dólares por millón de tokens de entrada y 9,00 dólares por millón de tokens de salida, lo que lo hace de tres a veinte veces más caro que los modelos Flash anteriores. Supera en precio a Claude Sonnet 4.6 (3/15 dólares), posicionándolo como una opción de gama media más que el producto económico que representaban las versiones Flash anteriores. Invezz
La señal de precio es deliberada. Google no está intentando competir en el segmento más barato del mercado — ese espacio lo ocupa el propio Gemini 3 Flash a 0,50 dólares por millón. Está posicionando el 3.5 como la opción de equilibrio calidad-coste para equipos enterprise que hoy pagan tarifas de modelo flagship pero podrían obtener rendimiento similar a un coste menor.
Gemini Spark, AI Ultra y el nuevo plan de 100 dólares
El lanzamiento del modelo vino acompañado de una reestructuración de los planes de suscripción que tiene implicaciones directas para los desarrolladores.
Google lanzó un nuevo plan AI Ultra de 100 dólares al mes para desarrolladores, directores técnicos y creadores avanzados, con acceso a Gemini 3.5 Flash, cinco veces más límite de uso que el plan Pro, prioridad en Google Antigravity, 20 TB de almacenamiento en la nube y YouTube Premium incluido. Simultáneamente, redujo el precio del plan AI Ultra de 250 a 200 dólares al mes, manteniendo las mismas capacidades. BrightEdge
Gemini Spark, el agente personal 24/7 que corre sobre Gemini 3.5 Flash en máquinas virtuales dedicadas de Google Cloud, se lanza esta semana para testers de confianza y en Beta para suscriptores de AI Ultra en EE.UU. Shopify usa subagentes de 3.5 Flash en paralelo para análisis de datos de comerciantes. Macquarie Bank lo aplica a documentos de más de cien páginas en el proceso de incorporación de clientes. Salesforce lo ha integrado en Agentforce para automatización enterprise de múltiples pasos. BrightEdge
La compresión entre gamas que Glitchwire ha señalado es la tendencia más relevante del I/O 2026: si el modelo Flash ya supera al Pro anterior en benchmarks críticos, la distinción entre tiers de producto se vuelve cada vez más difícil de sostener como argumento de venta. Google está apostando a que la velocidad y el coste son suficiente diferenciación incluso cuando la calidad converge.
Fuentes
Seguir leyendo
NuevoAnthropic lanza Claude Opus 4.8 hoy: cuatro veces menos errores en código y mayor honestidad sobre sus propios fallos
Apenas seis semanas después de Opus 4.7, Anthropic lanza Opus 4.8 al mismo precio con mejoras en codificación agéntica, fiabilidad y alineación. Es cuatro veces menos probable que ignore errores en el código que genera.
NuevoOpenAI admitió que el modo de voz de ChatGPT corre en un modelo más débil del que anunció — y los desarrolladores lo detectaron antes
Una controversia estalló esta semana cuando desarrolladores probaron que la voz de ChatGPT no usa GPT-5.5 sino un modelo interno más pequeño. OpenAI reconoció la discrepancia y actualizó su documentación.

Google publicó hoy la lista completa de sus 100 anuncios del I/O: los más relevantes que pasaron desapercibidos
Veo con audio nativo, Imagen 4, Project Astra integrado en AI Mode, Science Skills para investigación biomédica y detección de contenido generado por IA en Search. El I/O fue más grande de lo que cubrieron los titulares.