El Proyecto Glasswing de Anthropic encontró 10.000 vulnerabilidades críticas en 30 días — y el cuello de botella ya no es encontrarlas
La primera actualización de Glasswing confirma que Claude Mythos identificó más de 10.000 vulnerabilidades en software crítico en un mes. El problema ahora es que los equipos humanos no pueden arreglarlas al mismo ritmo.

El 7 de abril, Anthropic presentó el Proyecto Glasswing y Claude Mythos Preview con una premisa inusual: el modelo es tan capaz en ciberseguridad ofensiva que no pueden publicarlo de forma general. Para justificar esa afirmación, dieron acceso a aproximadamente 50 organizaciones — entre ellas Cloudflare, Microsoft, Amazon y varios organismos gubernamentales — con un mandato concreto: usar Mythos para encontrar vulnerabilidades en software crítico y arreglarlas antes de que las encontraran los atacantes.
El 22 de mayo, Anthropic publicó su primera actualización de progreso. Los números son difíciles de contextualizar porque no tienen precedente.
En aproximadamente 30 días, Claude Mythos Preview y aproximadamente 50 organizaciones partner identificaron más de 10.000 vulnerabilidades de severidad alta o crítica en software sistémicamente importante. De las 10.000 iniciales, 6.202 fueron clasificadas como de severidad alta o crítica en más de 1.000 proyectos de código abierto. El análisis experto posterior confirmó 1.726 como verdaderos positivos válidos. De esos, 1.094 fueron confirmados como de severidad alta o crítica. Meta Intelligence
Cloudflare, uno de los partners del lanzamiento, encontró 2.000 bugs en sus sistemas usando acceso de Glasswing, 400 de los cuales eran de severidad alta o crítica. Meta Intelligence
Para tener una referencia: el programa de bug bounty de Cloudflare lleva años activo con miles de investigadores de seguridad participando. En ese tiempo, los investigadores humanos han encontrado cientos de vulnerabilidades. Mythos encontró 2.000 en Cloudflare sola en un mes. La diferencia de escala no es incremental — es estructural.
El cambio de paradigma que nadie esperaba: el cuello de botella ya no es encontrar
La conclusión más importante de la actualización de Glasswing no es el número de vulnerabilidades encontradas. Es lo que ese número revela sobre dónde está ahora el problema.
El cuello de botella no es encontrar problemas. Es arreglarlos. La IA puede ahora generar un flujo interminable de informes de vulnerabilidades válidos. Los equipos de ingeniería humanos no pueden procesarlos al mismo ritmo al que se generan. Meta Intelligence
Esto invierte completamente la forma en que el sector de la ciberseguridad ha pensado su trabajo durante décadas. El modelo tradicional asumía que encontrar vulnerabilidades era la parte difícil — requería expertise especializado, tiempo y en muchos casos acceso privilegiado a sistemas. Arreglarlas era tedioso pero manejable una vez encontradas.
Mythos ha destruido esa asimetría. Encontrar vulnerabilidades ya no es el cuello de botella. El cuello de botella es la capacidad humana de procesar, priorizar, verificar y arreglar los problemas que la IA identifica. Un equipo de seguridad que antes gestionaba 10 nuevos findings críticos al mes ahora puede recibir 400. La infraestructura humana de respuesta — los equipos de ingeniería, los procesos de revisión, las prioridades de desarrollo — no está diseñada para ese volumen.
IBM se une y Corea del Sur está en el pipeline
IBM se unió al programa Glasswing. Corea del Sur está en el pipeline de incorporación. La expansión muestra que el modelo de Glasswing — acceso restringido a modelo ofensivo a cambio de mejora de defensa colaborativa — está funcionando como mecanismo de distribución controlada. Meta Intelligence
La expansión geográfica e institucional del programa tiene consecuencias para el debate sobre gobernanza de IA que la semana pasada, con la cancelación de la orden ejecutiva de Trump, parecía haber llegado a un callejón sin salida. Si los gobiernos no pueden establecer marcos de supervisión voluntaria para modelos frontier, el modelo de Glasswing ofrece una alternativa: acceso controlado a los modelos más capaces a cambio de uso defensivo verificable y reporte de resultados.
No es regulación. Es un acuerdo voluntario entre Anthropic y sus partners que produce el mismo efecto que la regulación intentaba crear: supervisión del uso de los modelos más peligrosos, con resultados medibles y verificables. Que IBM — una empresa con presencia en prácticamente todos los sectores regulados del mundo — se una al programa es la señal más clara de que ese modelo tiene tracción más allá de los laboratorios de ciberseguridad especializados.
Las implicaciones para la seguridad del software de código abierto
De los 10.000 iniciales, 6.202 fueron clasificadas en más de 1.000 proyectos de código abierto. Meta Intelligence
El software de código abierto es la infraestructura invisible de internet. Los navegadores web, los servidores, los sistemas de gestión de contenidos, los frameworks de desarrollo — la mayoría corre sobre código abierto que en muchos casos es mantenido por voluntarios o por equipos pequeños con recursos limitados para auditorías de seguridad.
1.000 proyectos de código abierto con vulnerabilidades confirmadas en 30 días es un número que debería preocupar a cualquier organización que usa software, que es todas. Y la mayoría de esas vulnerabilidades han existido en el código durante meses o años sin ser detectadas, simplemente porque no había suficientes investigadores de seguridad con tiempo para buscarlas.
Lo que Glasswing demuestra es que la IA puede hacer esa búsqueda a una escala que los humanos no podían. La pregunta que el programa todavía no ha respondido es si la capacidad de arreglar esas vulnerabilidades puede escalar de forma comparable. Los 1.094 findings confirmados como críticos que siguen pendientes de resolución son la evidencia de que, por ahora, no puede.
Lo que viene en la segunda fase de Glasswing
La actualización de mayo menciona que el programa está evaluando ampliar el acceso a más organizaciones y sectores, con foco especial en infraestructura crítica — redes eléctricas, sistemas de agua, infraestructura financiera — que tiene tanto la mayor exposición a ataques como los ciclos de actualización más lentos.
La paradoja de esa expansión es la misma que definió el debate en abril: cuantas más organizaciones tienen acceso a Mythos para uso defensivo, mayor es el riesgo de que alguien use ese acceso de forma ofensiva, deliberada o accidentalmente. El acceso no autorizado de Discord al modelo que cubrimos en abril — obtenido simplemente adivinando la URL del endpoint — es el recordatorio más concreto de que los controles de acceso tienen límites reales incluso con la mejor intención.
La pregunta que Glasswing está respondiendo mes a mes es si ese riesgo está suficientemente mitigado por el beneficio de acelerar la detección y corrección de vulnerabilidades en software que de otra forma seguirían sin detectarse durante años. Los 10.000 findings del primer mes sugieren que el beneficio es real. Los 1.094 críticos todavía sin resolver sugieren que el sistema completo todavía necesita más trabajo.
Fuentes
Seguir leyendo

China prohíbe a sus mejores investigadores de IA viajar al extranjero sin permiso del gobierno
Alibaba y DeepSeek confirman las restricciones que Bloomberg publicó esta mañana. El gobierno exige aprobación previa para viajes internacionales a fundadores, investigadores y ejecutivos de IA estratégica.

«Magnifica Humanitas»: el Papa León XIV presentó hoy la primera encíclica sobre IA de la historia junto a un cofundador de Anthropic
La primera encíclica sobre IA de la historia se presentó hoy en el Vaticano con Anthropic en el estrado. León XIV enmarca la IA como la Revolución Industrial de nuestro tiempo y pide protección humana en su desarrollo.

El cofundador de Anthropic predice un Nobel para la IA en 12 meses — y admite que puede matar a todos
Clark predijo en Oxford un Nobel para la IA en 12 meses y reconoció que hay probabilidad no nula de que mate a todos. Lo dijo mientras Anthropic reporta su primer beneficio y apunta a 900.000 millones de valoración.