Anthropic advirtió la semana pasada que sus modelos pueden volverse incontrolables — y ayer publicó el más poderoso de su historia
La misma semana en que Anthropic pidió a los laboratorios un freno coordinado citando el riesgo de mejora recursiva autónoma, lanzó Fable 5. La paradoja define mejor que nada la posición de la empresa en 2026.

El lanzamiento de Fable sigue a la petición de Anthropic instando a los principales laboratorios globales de IA a establecer un freno coordinado en el desarrollo de IA frontier. Anthropic advirtió que los sistemas están avanzando tan rápidamente que pronto pueden lograr mejora recursiva de sí mismos, mejorándose de forma autónoma sin intervención humana. Google AI
La misma empresa que pidió a la industria un freno coordinado la semana pasada publicó ayer el modelo de IA más potente que ha lanzado al público en su historia. Eso es una contradicción en apariencia. En realidad es la descripción más precisa posible de la posición en que viven todos los laboratorios frontier en 2026.
La pregunta más grande que el lanzamiento plantea es la que Anthropic ha estado rodeando desde abril: modelos igualmente capaces de otros laboratorios están llegando, y no todos llegarán con una pared de clasificadores delante. La ventaja defensiva que Glasswing pretendía ganar solo importa si el resto de la industria la usa. Google
La petición de freno coordinado y lo que significa
La advertencia que Anthropic publicó la semana pasada no fue un comunicado de prensa genérico sobre los riesgos de la IA. Fue una petición específica a los laboratorios frontier — OpenAI, Google DeepMind, Meta, Mistral, DeepSeek — para establecer un mecanismo coordinado que ralentice el desarrollo cuando los sistemas alcancen determinados umbrales de capacidad.
Anthropic advirtió que los sistemas están avanzando tan rápidamente que pronto pueden lograr mejora recursiva de sí mismos (RSI), mejorándose de forma autónoma sin intervención humana. Google AI
La mejora recursiva autónoma es el concepto que Jack Clark describió en Oxford como «intelligence explosion» — el punto en que una IA puede mejorar su propio diseño sin supervisión humana en cada iteración, generando un ciclo de retroalimentación que escala más rápido de lo que cualquier mecanismo de control puede seguir.
Que Anthropic use ese término en una petición pública a otros laboratorios es una escalada del lenguaje respecto a cualquier comunicación anterior de la empresa. No es Jack Clark hablando en una conferencia académica. Es la empresa formalmente pidiendo a sus competidores que acuerden no correr hacia ese precipicio sin frenos.
Por qué publicaron Fable 5 de todas formas
La pregunta que más aparece en los comentarios sobre el lanzamiento de ayer es la más obvia: si Anthropic cree que sus modelos pueden volverse incontrolables, ¿por qué publica el más potente de su historia?
La respuesta que Anthropic da, implícita en sus comunicaciones y explícita en las entrevistas de Dario Amodei de los últimos meses, tiene tres partes.
Primera: no publicar no detiene el progreso. Si Anthropic no publica Fable 5, OpenAI publicará GPT-6. Google publicará Gemini 4. DeepSeek publicará V5. Los modelos más capaces van a existir independientemente de lo que Anthropic decida. La pregunta es si van a existir con las salvaguardas que Anthropic ha construido o sin ellas.
Segunda: la única forma de construir los sistemas de seguridad que los modelos más capaces necesitan es tener acceso a esos modelos. Los clasificadores de Fable 5 son el resultado de meses de trabajo con el modelo Mythos en entornos controlados. Sin haber construido y probado el modelo internamente, esos clasificadores no existirían.
Tercera: la posición en el mercado importa para la misión. El lanzamiento de Fable llega cuando Anthropic se prepara para entrar en los mercados públicos. Una empresa que pierde posición competitiva porque es demasiado cautelosa para publicar sus mejores modelos también pierde la capacidad de influir en cómo se desarrolla la industria. Los ingresos, la valoración y la influencia son las herramientas con las que Anthropic puede presionar a otros laboratorios y a los gobiernos para que adopten estándares de seguridad. Google AI
La crítica que el argumento no resuelve completamente
Hay una versión de la crítica a la posición de Anthropic que ninguno de esos tres argumentos responde por completo.
Si Anthropic cree genuinamente que sus modelos pueden alcanzar mejora recursiva autónoma en un horizonte cercano, y si cree que ese evento tiene una «probabilidad no nula» de ser catastrófico como dijo Jack Clark en Oxford, entonces la decisión de publicar el modelo más potente de su historia la semana después de hacer esa advertencia requiere una explicación más robusta que «de todas formas alguien lo hará».
El argumento de «race to the top» — que es mejor que la empresa más seria sobre seguridad lidere el desarrollo frontier que dejarlo a las menos serias — tiene una lógica. Pero también tiene un límite: si el riesgo supera un determinado umbral, el argumento de «nosotros lo hacemos con más cuidado» deja de ser suficiente.
La ventaja defensiva que Glasswing pretendía ganar solo importa si el resto de la industria la usa. Si los clasificadores de Fable 5 permanecen como tecnología propietaria de Anthropic, y si los próximos modelos frontier de otros laboratorios llegan sin mecanismos equivalentes, la ventaja defensiva que Anthropic ha construido no escala a la industria — solo protege a los usuarios de Anthropic. Google
La petición de freno coordinado de la semana pasada es el intento de resolver esa limitación: no solo construir salvaguardas propias sino conseguir que el resto de la industria las adopte. Si esa petición no produce resultados — y no hay señales de que OpenAI, Google o los laboratorios chinos vayan a aceptarla — Anthropic habrá publicado Fable 5 y habrá fallado en crear el mecanismo coordinado que consideraba necesario. Ese es el escenario que define el debate más importante del sector en los próximos meses.
Fuentes
Seguir leyendo

El Congreso presentó el Great American AI Act: 269 páginas que anulan todas las leyes estatales de IA durante tres años
Un borrador de 269 páginas congela la regulación estatal de IA tres años, obliga a reportar incidentes y crea un centro federal de estándares. Es el primer intento serio de legislación federal de IA en EE.UU.

Trump y Bernie Sanders coinciden: el gobierno debería tener participación en las grandes empresas de IA
La administración Trump y OpenAI están discutiendo una posible participación gubernamental en la empresa. Sanders lo propone desde la izquierda, Trump lo considera desde la derecha. El debate llegó a Washington.

Trump firmó ayer la orden ejecutiva de IA que había cancelado: revisión voluntaria de modelos y acceso federal a Mythos
Diez días después de cancelarla por presión de Musk y Zuckerberg, Trump firmó una versión revisada de la orden ejecutiva de IA. Revisión voluntaria a 90 días y acceso federal a Mythos bajo salvaguardas del OMB.