El ban de Fable 5 no era por un jailbreak — y los expertos en ciberseguridad están furiosos con el gobierno
El «jailbreak» que retiró Fable 5 era la diferencia entre «revisa este código» y «arréglalo». Expertos dicen que el gobierno se equivocó y que arreglarlo destruiría la utilidad defensiva del modelo para defensa.

Cuando el gobierno americano ordenó retirar Fable 5 y Mythos 5 del mercado el 12 de junio, el comunicado oficial habló de un «jailbreak» que había alertado a la administración sobre riesgos de seguridad nacional. La palabra «jailbreak» evoca imágenes de hackers descubriendo formas de desbloquear capacidades ofensivas ocultas, de barreras de seguridad rotas de forma sofisticada.
La realidad, revelada hoy por TechCrunch, es considerablemente más prosaica — y por eso mismo más preocupante para el futuro de la regulación de IA.
La diferencia es principalmente entre pedirle a un modelo de IA «revisar código para detectar problemas de seguridad» versus «arreglar este código». El resultado final es prácticamente el mismo, aunque las preguntas se formulen de forma ligeramente diferente. TechCrunch
Eso es lo que el gobierno americano llamó «jailbreak». No una técnica sofisticada de ingeniería de prompts. No un exploit que accede a capacidades ocultas. La diferencia entre dos formulaciones distintas de la misma tarea legítima de desarrollo de software.
El paper de Amazon que desencadenó todo
Katie Moussouris, veterana de la ciberseguridad e investigadora que fundó Luta Security, dijo en un blog post que Anthropic compartió recientemente con ella una copia privada de un paper escrito por investigadores de seguridad describiendo un supuesto bypass de las salvaguardas en Fable 5. The Wall Street Journal reportó que los autores del paper son investigadores de seguridad de Amazon. TechCrunch
Moussouris dijo que Anthropic se puso en contacto con ella para pedir su opinión sobre el paper. Su blog post describió cómo los investigadores activaron el bypass de la salvaguarda, pero dijo que el bypass en sí «nunca debería haber activado un control de exportación». TechCrunch
El paper de los investigadores de Amazon — uno de los principales socios de Anthropic a través de AWS Bedrock — es la fuente que llegó al Departamento de Comercio y activó la directiva de control de exportaciones que forzó la retirada de ambos modelos. El gobierno recibió el paper, concluyó que describía un jailbreak que comprometía la seguridad nacional, y actuó.
Moussouris criticó la directiva de control de exportaciones como precipitada. La investigadora tiene credenciales en este ámbito que son difíciles de cuestionar: es una de las personas que más ha trabajado en política de divulgación de vulnerabilidades, negociación de bug bounties y la intersección entre investigación de seguridad y política gubernamental. Su evaluación de que el comportamiento descrito en el paper no justificaba un control de exportación no es la opinión de alguien sin contexto — es la de quien conoce mejor que nadie la diferencia entre una vulnerabilidad real y un artefacto de la naturaleza dual de cualquier herramienta de seguridad. TechCrunch
Por qué el comportamiento no puede arreglarse sin destruir el modelo
«El comportamiento descrito en el paper no puede arreglarse de manera significativa, y cualquier intento solo debilitaría el modelo para la defensa», dijo Moussouris. TechCrunch
Esta es la parte más técnica del argumento y la más importante para entender por qué el ban es problemático más allá de la política.
Fable 5 y Mythos 5 son valiosos para la defensa precisamente porque pueden analizar código y encontrar vulnerabilidades. Esa capacidad — leer código, entender su funcionamiento, identificar patrones que podrían explotarse — es indistinguible entre uso ofensivo y defensivo desde el punto de vista del modelo. El mismo conocimiento que permite a un investigador de seguridad de Cloudflare encontrar vulnerabilidades en su propio código permitiría a un atacante encontrar vulnerabilidades en el código de otro.
IBM X-Force describió cómo Fable 5 «rechaza cualquier solicitud que pueda estar tangencialmente relacionada con ciberseguridad» — ya en los días anteriores a la suspensión, el modelo generaba críticas por ser demasiado restrictivo para el trabajo defensivo legítimo. MyStudyLife
La paradoja que esto crea es la siguiente: el modelo que el Proyecto Glasswing usó para encontrar 10.000 vulnerabilidades en software crítico en 30 días fue posible porque Mythos podía hacer exactamente lo que los clasificadores de Fable 5 intentan prevenir. Si los clasificadores son suficientemente estrictos para satisfacer al gobierno, el modelo pierde la utilidad que lo hacía valioso para defensa. Si son suficientemente permisivos para ser útiles en defensa, cualquier formulación alternativa de la misma tarea los puede sortear.
Lo que TechCrunch argumenta: nunca fue sobre el jailbreak
El resultado fue que el gobierno americano logró forzar a una empresa tecnológica a retirar sus modelos offline con una acción rápida y unilateral que aparentemente no requirió aprobación judicial. La intervención del viernes de la administración Trump muestra que la industria de la IA no es inmune a la interferencia gubernamental. TechCrunch
TechCrunch argumenta hoy que la narrativa del jailbreak es una cobertura para lo que realmente ocurrió: la administración Trump usó la autoridad de control de exportaciones — una herramienta diseñada para regular el envío de tecnología física a países enemigos — para intervenir en el despliegue de software de un laboratorio de IA con el que tiene un conflicto político activo.
El conflicto entre Anthropic y la administración Trump lleva meses en los medios. El Pentágono declaró a Anthropic «riesgo de cadena de suministro» en febrero. Anthropic demandó al gobierno. Un juez federal bloqueó parte de las restricciones. Y ahora el Departamento de Comercio, dirigido por Howard Lutnick, usó una directiva de control de exportaciones para retirar los dos modelos más avanzados de Anthropic del mercado global — basándose en un paper de investigadores de Amazon que describe un comportamiento que los expertos independientes dicen que no justifica esa respuesta.
Anthropic dijo que había recibido solo notificación verbal de un «potencial jailbreak estrecho y no universal» del gobierno y discrepó en que debería ser motivo para una retirada. El timing del anuncio podría ser dañino para Anthropic, llegando antes de una esperada oferta pública inicial en EE.UU. Monday.com
Las consecuencias para la investigación de seguridad y el ecosistema enterprise
Para ponerte al día en el aluvión de noticias: el viernes por la tarde, el Departamento de Comercio de EE.UU. envió a Anthropic una carta invocando una oscura directiva de control de exportaciones que prohibía a los no estadounidenses, incluyendo los empleados de Anthropic, acceder a Fable 5 y Mythos 5, citando una preocupación de seguridad nacional no especificada. TechCrunch
Las consecuencias prácticas para el ecosistema de seguridad son directas. Los equipos de seguridad de KPMG, Deloitte, JPMorgan, Goldman Sachs y los otros clientes enterprise que habían integrado Claude en sus flujos de trabajo de análisis de código se encontraron el viernes por la tarde con que los modelos más capaces de su herramienta principal simplemente dejaron de funcionar. Sin previo aviso. Sin periodo de transición. Sin orientación sobre cuándo volverán a estar disponibles.
El Mozilla que reportó resolver cientos de vulnerabilidades con Mythos Preview en el Proyecto Glasswing — uno de los casos de uso más concretos del impacto real del programa — está ahora sin acceso a esa herramienta en el momento en que el volumen de vulnerabilidades por resolver supera la capacidad de sus equipos humanos.
La ironía que Snyk señala en su análisis técnico del episodio es exacta: el modelo estaba siendo criticado durante la misma semana por ser demasiado restrictivo para los defensores, y fue retirado por una capacidad usada en defensa. La capacidad es de doble uso, que es una propiedad familiar en seguridad. MyStudyLife
Fuentes
Seguir leyendo

El gobierno americano ordenó retirar Fable 5 y Mythos 5 del mercado: la primera intervención directa del Estado en la IA frontier
El Departamento de Comercio ordenó el viernes retirar Fable 5 y Mythos 5 citando seguridad nacional. Es la primera vez que el gobierno americano fuerza a una empresa de IA a retirar un modelo ya desplegado públicamente.

Anthropic advirtió la semana pasada que sus modelos pueden volverse incontrolables — y ayer publicó el más poderoso de su historia
La misma semana en que Anthropic pidió a los laboratorios un freno coordinado citando el riesgo de mejora recursiva autónoma, lanzó Fable 5. La paradoja define mejor que nada la posición de la empresa en 2026.

El Congreso presentó el Great American AI Act: 269 páginas que anulan todas las leyes estatales de IA durante tres años
Un borrador de 269 páginas congela la regulación estatal de IA tres años, obliga a reportar incidentes y crea un centro federal de estándares. Es el primer intento serio de legislación federal de IA en EE.UU.