El ban de Fable 5 no era por un jailbreak — y los expertos en ciberseguridad están furiosos con el gobierno

El «jailbreak» que retiró Fable 5 era la diferencia entre «revisa este código» y «arréglalo». Expertos dicen que el gobierno se equivocó y que arreglarlo destruiría la utilidad defensiva del modelo para defensa.

Gonzalo· Fundador

16 de junio de 2026 · 6 min de lectura

Asistido por IA · revisado por el editor

Cuando el gobierno americano ordenó retirar Fable 5 y Mythos 5 del mercado el 12 de junio, el comunicado oficial habló de un «jailbreak» que había alertado a la administración sobre riesgos de seguridad nacional. La palabra «jailbreak» evoca imágenes de hackers descubriendo formas de desbloquear capacidades ofensivas ocultas, de barreras de seguridad rotas de forma sofisticada.

La realidad, revelada hoy por TechCrunch, es considerablemente más prosaica — y por eso mismo más preocupante para el futuro de la regulación de IA.

La diferencia es principalmente entre pedirle a un modelo de IA «revisar código para detectar problemas de seguridad» versus «arreglar este código». El resultado final es prácticamente el mismo, aunque las preguntas se formulen de forma ligeramente diferente. TechCrunch

Eso es lo que el gobierno americano llamó «jailbreak». No una técnica sofisticada de ingeniería de prompts. No un exploit que accede a capacidades ocultas. La diferencia entre dos formulaciones distintas de la misma tarea legítima de desarrollo de software.

El paper de Amazon que desencadenó todo

Katie Moussouris, veterana de la ciberseguridad e investigadora que fundó Luta Security, dijo en un blog post que Anthropic compartió recientemente con ella una copia privada de un paper escrito por investigadores de seguridad describiendo un supuesto bypass de las salvaguardas en Fable 5. The Wall Street Journal reportó que los autores del paper son investigadores de seguridad de Amazon. TechCrunch

Moussouris dijo que Anthropic se puso en contacto con ella para pedir su opinión sobre el paper. Su blog post describió cómo los investigadores activaron el bypass de la salvaguarda, pero dijo que el bypass en sí «nunca debería haber activado un control de exportación». TechCrunch

El paper de los investigadores de Amazon — uno de los principales socios de Anthropic a través de AWS Bedrock — es la fuente que llegó al Departamento de Comercio y activó la directiva de control de exportaciones que forzó la retirada de ambos modelos. El gobierno recibió el paper, concluyó que describía un jailbreak que comprometía la seguridad nacional, y actuó.

Moussouris criticó la directiva de control de exportaciones como precipitada. La investigadora tiene credenciales en este ámbito que son difíciles de cuestionar: es una de las personas que más ha trabajado en política de divulgación de vulnerabilidades, negociación de bug bounties y la intersección entre investigación de seguridad y política gubernamental. Su evaluación de que el comportamiento descrito en el paper no justificaba un control de exportación no es la opinión de alguien sin contexto — es la de quien conoce mejor que nadie la diferencia entre una vulnerabilidad real y un artefacto de la naturaleza dual de cualquier herramienta de seguridad. TechCrunch

Por qué el comportamiento no puede arreglarse sin destruir el modelo

«El comportamiento descrito en el paper no puede arreglarse de manera significativa, y cualquier intento solo debilitaría el modelo para la defensa», dijo Moussouris. TechCrunch

Esta es la parte más técnica del argumento y la más importante para entender por qué el ban es problemático más allá de la política.

Fable 5 y Mythos 5 son valiosos para la defensa precisamente porque pueden analizar código y encontrar vulnerabilidades. Esa capacidad — leer código, entender su funcionamiento, identificar patrones que podrían explotarse — es indistinguible entre uso ofensivo y defensivo desde el punto de vista del modelo. El mismo conocimiento que permite a un investigador de seguridad de Cloudflare encontrar vulnerabilidades en su propio código permitiría a un atacante encontrar vulnerabilidades en el código de otro.

IBM X-Force describió cómo Fable 5 «rechaza cualquier solicitud que pueda estar tangencialmente relacionada con ciberseguridad» — ya en los días anteriores a la suspensión, el modelo generaba críticas por ser demasiado restrictivo para el trabajo defensivo legítimo. MyStudyLife

La paradoja que esto crea es la siguiente: el modelo que el Proyecto Glasswing usó para encontrar 10.000 vulnerabilidades en software crítico en 30 días fue posible porque Mythos podía hacer exactamente lo que los clasificadores de Fable 5 intentan prevenir. Si los clasificadores son suficientemente estrictos para satisfacer al gobierno, el modelo pierde la utilidad que lo hacía valioso para defensa. Si son suficientemente permisivos para ser útiles en defensa, cualquier formulación alternativa de la misma tarea los puede sortear.

Lo que TechCrunch argumenta: nunca fue sobre el jailbreak

El resultado fue que el gobierno americano logró forzar a una empresa tecnológica a retirar sus modelos offline con una acción rápida y unilateral que aparentemente no requirió aprobación judicial. La intervención del viernes de la administración Trump muestra que la industria de la IA no es inmune a la interferencia gubernamental. TechCrunch

TechCrunch argumenta hoy que la narrativa del jailbreak es una cobertura para lo que realmente ocurrió: la administración Trump usó la autoridad de control de exportaciones — una herramienta diseñada para regular el envío de tecnología física a países enemigos — para intervenir en el despliegue de software de un laboratorio de IA con el que tiene un conflicto político activo.

El conflicto entre Anthropic y la administración Trump lleva meses en los medios. El Pentágono declaró a Anthropic «riesgo de cadena de suministro» en febrero. Anthropic demandó al gobierno. Un juez federal bloqueó parte de las restricciones. Y ahora el Departamento de Comercio, dirigido por Howard Lutnick, usó una directiva de control de exportaciones para retirar los dos modelos más avanzados de Anthropic del mercado global — basándose en un paper de investigadores de Amazon que describe un comportamiento que los expertos independientes dicen que no justifica esa respuesta.

Anthropic dijo que había recibido solo notificación verbal de un «potencial jailbreak estrecho y no universal» del gobierno y discrepó en que debería ser motivo para una retirada. El timing del anuncio podría ser dañino para Anthropic, llegando antes de una esperada oferta pública inicial en EE.UU. Monday.com

Las consecuencias para la investigación de seguridad y el ecosistema enterprise

Para ponerte al día en el aluvión de noticias: el viernes por la tarde, el Departamento de Comercio de EE.UU. envió a Anthropic una carta invocando una oscura directiva de control de exportaciones que prohibía a los no estadounidenses, incluyendo los empleados de Anthropic, acceder a Fable 5 y Mythos 5, citando una preocupación de seguridad nacional no especificada. TechCrunch

Las consecuencias prácticas para el ecosistema de seguridad son directas. Los equipos de seguridad de KPMG, Deloitte, JPMorgan, Goldman Sachs y los otros clientes enterprise que habían integrado Claude en sus flujos de trabajo de análisis de código se encontraron el viernes por la tarde con que los modelos más capaces de su herramienta principal simplemente dejaron de funcionar. Sin previo aviso. Sin periodo de transición. Sin orientación sobre cuándo volverán a estar disponibles.

El Mozilla que reportó resolver cientos de vulnerabilidades con Mythos Preview en el Proyecto Glasswing — uno de los casos de uso más concretos del impacto real del programa — está ahora sin acceso a esa herramienta en el momento en que el volumen de vulnerabilidades por resolver supera la capacidad de sus equipos humanos.

La ironía que Snyk señala en su análisis técnico del episodio es exacta: el modelo estaba siendo criticado durante la misma semana por ser demasiado restrictivo para los defensores, y fue retirado por una capacidad usada en defensa. La capacidad es de doble uso, que es una propiedad familiar en seguridad. MyStudyLife

Fuentes

Enlaces a las fuentes originales en las que se apoya esta noticia. Contrasta cada dato en su origen.

TechCrunch (exclusiva hoy)techcrunch.com
Fortune (detalles del bypass)fortune.com
Snyk (análisis técnico)snyk.io

EtiquetasAnthropic Regulación Ética

En la elaboración de este artículo se ha utilizado inteligencia artificial como apoyo en la investigación y redacción. El contenido ha sido revisado editorialmente antes de su publicación.

GonzaloFundador

Madrileño enganchado a la tecnología desde pequeño. Trabajo en finanzas pero la inteligencia artificial es lo que me quita el sueño. Creé Miuranews para seguirla de cerca y contarla en español sin hype.

Todos sus artículos →

◈ Asistente Miuranews

Pregunta sobre este artículo

Respuestas basadas en esta pieza y en el archivo de Miuranews. Sin inventar: si no está cubierto, te lo dice.

Prueba una

Experimento en beta · No sustituye a la lectura del artículo

Sigue leyendo