Modelos

Gemini 3.5 Flash supera al antiguo Pro de Google siendo cuatro veces más rápido y un 40% más barato

Google lanzó ayer en el I/O su primer modelo de la familia 3.5. Supera a Gemini 3.1 Pro en codificación y agentes, cuesta 1,50 dólares por millón de tokens y ya es el modelo por defecto en la app y en Google Search.

G
Gonzalo· Fundador
· 4 min de lectura
Gemini 3.5 Flash

Hay un dato en el lanzamiento de Gemini 3.5 Flash que resume lo que está pasando en el mercado de modelos de IA mejor que cualquier benchmark: el modelo de la gama Flash, históricamente más barato y más ligero, ahora supera al modelo Pro de la generación anterior en las pruebas que más importan para agentes y código. Lo más económico se ha vuelto más capaz que lo que era la cima.

Gemini 3.5 Flash es el primer modelo de la nueva familia Gemini 3.5. Supera a Gemini 3.1 Pro en Terminal-Bench 2.1 (76.2%), MCP Atlas (83.6%) y GDPval-AA (1.656 Elo), corre aproximadamente cuatro veces más rápido en tokens de salida por segundo, y cuesta aproximadamente un 40% menos. Ya es el modelo por defecto en la app de Gemini y en AI Mode de Google Search para miles de millones de personas en todo el mundo. Business Today

El público en el Shoreline Amphitheatre recibió con un gemido colectivo la noticia de que Gemini 3.5 Pro, el verdadero sucesor del modelo flagship, llega en junio. Que el modelo que sí llegó ayer ya supere al Pro anterior es el dato que convierte ese gemido en algo más matizado.

Los benchmarks en contexto: dónde gana y dónde pierde

Los números de Google son sólidos en las pruebas que más importan para el mercado enterprise en 2026. El GDPval-AA, que mide rendimiento en tareas agénticas del mundo real, es el más revelador: Gemini 3.1 Pro puntuó 1.317 cuando se lanzó. Gemini 3.5 Flash puntúa 1.656. No es una mejora incremental — es un salto de categoría.

Contra el campo más amplio, el panorama es competitivo más que dominante. A mayo de 2026, GPT-5.5 lidera muchos benchmarks de flujos de trabajo agénticos, y Claude Opus 4.7 lidera varios benchmarks de codificación como SWE-bench Verified con la tasa de alucinación más baja de los tres. La ventaja de Gemini es velocidad y precio a calidad casi-flagship. Business Today

En benchmarks comparativos directos con competidores: Terminal-bench 2.1 (codificación), Gemini 3.5 Flash puntúa 76.2% frente al 78.2% de GPT-5.5 y el 66.1% de Claude Opus 4.7. En GDPval-AA (agéntico), 1.656 frente a 1.769 de GPT-5.5 y 1.753 de Claude Opus 4.7. En MMMU-Pro (multimodal), 83.6% frente a 81.2% de GPT-5.5 y 75.2% de Claude Opus 4.7. GlobeNewswire

El patrón que emerge: Gemini 3.5 Flash gana en multimodal y en velocidad, pierde en razonamiento puro y en codificación compleja. Para agentes que necesitan procesar texto, imagen, vídeo y audio simultáneamente a alta velocidad y bajo coste, el caso es convincente. Para debugging complejo de código o razonamiento matemático profundo, Claude y GPT-5.5 siguen siendo mejores opciones.

El precio que redefine la gama media del mercado

Gemini 3.5 Flash cuesta 1,50 dólares por millón de tokens de entrada y 9,00 dólares por millón de tokens de salida, lo que lo hace de tres a veinte veces más caro que los modelos Flash anteriores. Supera en precio a Claude Sonnet 4.6 (3/15 dólares), posicionándolo como una opción de gama media más que el producto económico que representaban las versiones Flash anteriores. Invezz

La señal de precio es deliberada. Google no está intentando competir en el segmento más barato del mercado — ese espacio lo ocupa el propio Gemini 3 Flash a 0,50 dólares por millón. Está posicionando el 3.5 como la opción de equilibrio calidad-coste para equipos enterprise que hoy pagan tarifas de modelo flagship pero podrían obtener rendimiento similar a un coste menor.

Gemini Spark, AI Ultra y el nuevo plan de 100 dólares

El lanzamiento del modelo vino acompañado de una reestructuración de los planes de suscripción que tiene implicaciones directas para los desarrolladores.

Google lanzó un nuevo plan AI Ultra de 100 dólares al mes para desarrolladores, directores técnicos y creadores avanzados, con acceso a Gemini 3.5 Flash, cinco veces más límite de uso que el plan Pro, prioridad en Google Antigravity, 20 TB de almacenamiento en la nube y YouTube Premium incluido. Simultáneamente, redujo el precio del plan AI Ultra de 250 a 200 dólares al mes, manteniendo las mismas capacidades. BrightEdge

Gemini Spark, el agente personal 24/7 que corre sobre Gemini 3.5 Flash en máquinas virtuales dedicadas de Google Cloud, se lanza esta semana para testers de confianza y en Beta para suscriptores de AI Ultra en EE.UU. Shopify usa subagentes de 3.5 Flash en paralelo para análisis de datos de comerciantes. Macquarie Bank lo aplica a documentos de más de cien páginas en el proceso de incorporación de clientes. Salesforce lo ha integrado en Agentforce para automatización enterprise de múltiples pasos. BrightEdge

La compresión entre gamas que Glitchwire ha señalado es la tendencia más relevante del I/O 2026: si el modelo Flash ya supera al Pro anterior en benchmarks críticos, la distinción entre tiers de producto se vuelve cada vez más difícil de sostener como argumento de venta. Google está apostando a que la velocidad y el coste son suficiente diferenciación incluso cuando la calidad converge.

Fuentes

EtiquetasGeminiGoogle DeepMindBenchmarksInferencia IA

Seguir leyendo