Ética

Anthropic advirtió la semana pasada que sus modelos pueden volverse incontrolables — y ayer publicó el más poderoso de su historia

La misma semana en que Anthropic pidió a los laboratorios un freno coordinado citando el riesgo de mejora recursiva autónoma, lanzó Fable 5. La paradoja define mejor que nada la posición de la empresa en 2026.

G
Gonzalo· Fundador
· 5 min de lectura
Dario Amodei

El lanzamiento de Fable sigue a la petición de Anthropic instando a los principales laboratorios globales de IA a establecer un freno coordinado en el desarrollo de IA frontier. Anthropic advirtió que los sistemas están avanzando tan rápidamente que pronto pueden lograr mejora recursiva de sí mismos, mejorándose de forma autónoma sin intervención humana. Google AI

La misma empresa que pidió a la industria un freno coordinado la semana pasada publicó ayer el modelo de IA más potente que ha lanzado al público en su historia. Eso es una contradicción en apariencia. En realidad es la descripción más precisa posible de la posición en que viven todos los laboratorios frontier en 2026.

La pregunta más grande que el lanzamiento plantea es la que Anthropic ha estado rodeando desde abril: modelos igualmente capaces de otros laboratorios están llegando, y no todos llegarán con una pared de clasificadores delante. La ventaja defensiva que Glasswing pretendía ganar solo importa si el resto de la industria la usa. Google

La petición de freno coordinado y lo que significa

La advertencia que Anthropic publicó la semana pasada no fue un comunicado de prensa genérico sobre los riesgos de la IA. Fue una petición específica a los laboratorios frontier — OpenAI, Google DeepMind, Meta, Mistral, DeepSeek — para establecer un mecanismo coordinado que ralentice el desarrollo cuando los sistemas alcancen determinados umbrales de capacidad.

Anthropic advirtió que los sistemas están avanzando tan rápidamente que pronto pueden lograr mejora recursiva de sí mismos (RSI), mejorándose de forma autónoma sin intervención humana. Google AI

La mejora recursiva autónoma es el concepto que Jack Clark describió en Oxford como «intelligence explosion» — el punto en que una IA puede mejorar su propio diseño sin supervisión humana en cada iteración, generando un ciclo de retroalimentación que escala más rápido de lo que cualquier mecanismo de control puede seguir.

Que Anthropic use ese término en una petición pública a otros laboratorios es una escalada del lenguaje respecto a cualquier comunicación anterior de la empresa. No es Jack Clark hablando en una conferencia académica. Es la empresa formalmente pidiendo a sus competidores que acuerden no correr hacia ese precipicio sin frenos.

Por qué publicaron Fable 5 de todas formas

La pregunta que más aparece en los comentarios sobre el lanzamiento de ayer es la más obvia: si Anthropic cree que sus modelos pueden volverse incontrolables, ¿por qué publica el más potente de su historia?

La respuesta que Anthropic da, implícita en sus comunicaciones y explícita en las entrevistas de Dario Amodei de los últimos meses, tiene tres partes.

Primera: no publicar no detiene el progreso. Si Anthropic no publica Fable 5, OpenAI publicará GPT-6. Google publicará Gemini 4. DeepSeek publicará V5. Los modelos más capaces van a existir independientemente de lo que Anthropic decida. La pregunta es si van a existir con las salvaguardas que Anthropic ha construido o sin ellas.

Segunda: la única forma de construir los sistemas de seguridad que los modelos más capaces necesitan es tener acceso a esos modelos. Los clasificadores de Fable 5 son el resultado de meses de trabajo con el modelo Mythos en entornos controlados. Sin haber construido y probado el modelo internamente, esos clasificadores no existirían.

Tercera: la posición en el mercado importa para la misión. El lanzamiento de Fable llega cuando Anthropic se prepara para entrar en los mercados públicos. Una empresa que pierde posición competitiva porque es demasiado cautelosa para publicar sus mejores modelos también pierde la capacidad de influir en cómo se desarrolla la industria. Los ingresos, la valoración y la influencia son las herramientas con las que Anthropic puede presionar a otros laboratorios y a los gobiernos para que adopten estándares de seguridad. Google AI

La crítica que el argumento no resuelve completamente

Hay una versión de la crítica a la posición de Anthropic que ninguno de esos tres argumentos responde por completo.

Si Anthropic cree genuinamente que sus modelos pueden alcanzar mejora recursiva autónoma en un horizonte cercano, y si cree que ese evento tiene una «probabilidad no nula» de ser catastrófico como dijo Jack Clark en Oxford, entonces la decisión de publicar el modelo más potente de su historia la semana después de hacer esa advertencia requiere una explicación más robusta que «de todas formas alguien lo hará».

El argumento de «race to the top» — que es mejor que la empresa más seria sobre seguridad lidere el desarrollo frontier que dejarlo a las menos serias — tiene una lógica. Pero también tiene un límite: si el riesgo supera un determinado umbral, el argumento de «nosotros lo hacemos con más cuidado» deja de ser suficiente.

La ventaja defensiva que Glasswing pretendía ganar solo importa si el resto de la industria la usa. Si los clasificadores de Fable 5 permanecen como tecnología propietaria de Anthropic, y si los próximos modelos frontier de otros laboratorios llegan sin mecanismos equivalentes, la ventaja defensiva que Anthropic ha construido no escala a la industria — solo protege a los usuarios de Anthropic. Google

La petición de freno coordinado de la semana pasada es el intento de resolver esa limitación: no solo construir salvaguardas propias sino conseguir que el resto de la industria las adopte. Si esa petición no produce resultados — y no hay señales de que OpenAI, Google o los laboratorios chinos vayan a aceptarla — Anthropic habrá publicado Fable 5 y habrá fallado en crear el mecanismo coordinado que consideraba necesario. Ese es el escenario que define el debate más importante del sector en los próximos meses.

Fuentes

EtiquetasAnthropicÉticaRegulación

Seguir leyendo