Modelos

Mistral lanza Medium 3.5: un modelo de 128.000 millones de parámetros que corre en cuatro GPUs y unifica razonamiento, código y chat

Mistral fusiona tres modelos anteriores en uno solo con 256.000 tokens de contexto, pesos abiertos y agentes de código asíncronos en la nube. La apuesta europea más ambiciosa del año en el segmento frontier.

G
Gonzalo· Fundador
· 5 min de lectura
Mistral Medium

En el ecosistema de modelos de IA frontera hay una tendencia clara: cada laboratorio mantiene un modelo para el chat general, otro para el razonamiento complejo y otro para el código. Tres endpoints, tres líneas de facturación, tres formas distintas de configurar un agente según la tarea. Mistral acaba de apostarlo todo a lo contrario.

Mistral Medium 3.5 es el primer modelo fusionado de la empresa. Es un modelo denso de 128.000 millones de parámetros con una ventana de contexto de 256.000 tokens, que maneja seguimiento de instrucciones, razonamiento y código en un único conjunto de pesos. Un modelo, una integración, un precio. El esfuerzo de razonamiento se configura por solicitud: la misma llamada a la API puede pedir una respuesta rápida de chat o activar el modo de razonamiento profundo para una tarea compleja de planificación, sin cambiar de modelo. eweek

La decisión arquitectónica que más llama la atención

La industria se ha movido masivamente hacia arquitecturas de Mezcla de Expertos (MoE), donde solo una fracción de los parámetros se activa por inferencia. Es el camino que han tomado DeepSeek V4, Qwen3 y prácticamente todos los modelos de gran tamaño lanzados en 2026.

Mistral ha elegido deliberadamente la arquitectura densa: los 128.000 millones de parámetros se cargan y activan en cada paso de inferencia, una decisión que contrasta con la ruta de dispersión que muchos competidores han tomado. Mistral Large 3 usaba una arquitectura MoE con 675.000 millones de parámetros totales y 41.000 millones activados por token. El nuevo flagship cambia esa dispersión por un coste predecible por token y un footprint de GPU menor, lo que importa más para las empresas que quieren autoalojarlo. Artificial Studio

El modelo corre en cuatro GPUs con cuantización FP8, un floor de despliegue que lo hace accesible para equipos que quieren mantener los pesos dentro de sus propias redes sin necesidad de infraestructura de data center. En versiones cuantizadas Q4, puede incluso correr en un Mac Studio con 192 GB de memoria unificada. The Decoder

Rendimiento: los números y las críticas que generaron

Mistral Medium 3.5 puntúa 77,6% en SWE-Bench Verified, la prueba estándar que evalúa si un modelo puede resolver issues reales de GitHub en repositorios de código abierto, y 91,4% en τ³-Telecom, una prueba de uso agéntico de herramientas en entornos especializados. how2shout

El 77,6% en SWE-Bench es un resultado sólido —supera a Devstral 2 y a Qwen3.5 397B A17B— pero no está exento de contexto crítico. El profesor de la Universidad de Washington Pedro Domingos escribió en redes sociales: «Las empresas normales de IA presumen de lo mucho mejor que es su modelo en benchmarks. Solo Mistral presume de lo mucho peor que es el suyo.» La referencia es a Qwen 3.6, un modelo de solo 27.000 millones de parámetros que puntúa 72,4% en el mismo benchmark a aproximadamente una cuarta parte del coste por token. Stanford

El precio de Medium 3.5 es 1,50 dólares por millón de tokens de entrada y 7,50 por millón de tokens de salida. Alibaba's Qwen 3.6 puntúa 72,4% en SWE-Bench Verified a aproximadamente una cuarta parte de ese coste. La diferencia de rendimiento no justifica necesariamente la diferencia de precio para todos los casos de uso, y eso ha generado debate entre desarrolladores. The Decoder

Vibe y los agentes asíncronos en la nube

La novedad técnica más significativa del lanzamiento no es el modelo en sí. Es lo que viene alrededor.

Vibe era un agente de código accesible a través de una CLI que permitía a un modelo de IA trabajar en tareas de software de forma autónoma. Hasta ahora, las sesiones de Vibe corrían localmente, lo que significaba que el agente estaba ligado al portátil del usuario y a su terminal. Con la actualización de hoy, las sesiones pueden lanzarse en la nube, migrar desde una sesión local sin perder el historial ni el estado de la tarea, y ejecutarse de forma asíncrona mientras el usuario hace otras cosas. Stanford

Con Vibe remoto, el usuario puede iniciar una sesión de codificación y teleportarla a la nube a mitad de tarea. Los agentes remotos ejecutan tareas de forma asíncrona en sandboxes aislados y pueden abrir pull requests en GitHub sin que el usuario esté en el terminal. Artificial Studio

Work Mode en Le Chat: el modo agéntico para no desarrolladores

Le Chat tiene ahora un Work Mode que usa Medium 3.5 para ejecución agéntica de tareas paralelas y de múltiples pasos. Puede trabajar en email, calendario, documentos, Jira y Slack simultáneamente, con todos los tool calls y pasos de razonamiento visibles, y requiere aprobación explícita antes de acciones sensibles. Stanford

Es la respuesta de Mistral al modo Work de Perplexity, al modo agéntico de ChatGPT Plus y a los Gems de Gemini: un asistente que no responde preguntas sino que ejecuta flujos de trabajo reales, dentro de un ecosistema de conectores que ya vienen activados por defecto.

La apuesta europea que hay detrás

Fuentes del sector indican que Mistral ha asegurado despliegues empresariales en Europa y que un banco firmó un acuerdo plurianual para autoalojar modelos de Mistral. La propuesta de valor que Mistral hace a ese segmento —autoalojamiento en cuatro GPUs, pesos abiertos, sede en la UE— tiene una lógica de soberanía de datos que ningún laboratorio americano puede ofrecer de la misma forma. Stanford

Michal Langmajer escribió que celebraba que un laboratorio no americano y no chino construyera modelos grandes, pero llamó a resultados técnicos más sólidos y precios más competitivos. Es exactamente la tensión que define la posición de Mistral en 2026: el único laboratorio frontier europeo con pesos abiertos y clientes empresariales reales, en un mercado donde la competencia de precio viene de China y la competencia de capacidad viene de Estados Unidos. Stanford

Fuentes

EtiquetasMistralMedium 3.5Open WeightsAgentes IAVibeEuropa IA

Seguir leyendo