Las preocupaciones de seguridad llevaron a Anthropic a restringir el acceso al modelo de IA de Claude tras el descubrimiento de numerosas vulnerabilidades

Anthropic ha tomado la decisión de mantener su último sistema de inteligencia artificial, Claude Mythos, fuera de la disponibilidad pública. Según la empresa, el modelo posee una capacidad excepcional para identificar fallos críticos de seguridad del software, lo que presenta riesgos demasiado importantes para una distribución generalizada. Esto es grande... Anthropic acaba de anunciar un modelo tan poderoso que no lo lanzarán al público por temor al daño que causará 😨 Claude Mythos Preview encontró miles de exploits de día cero en todos los principales sistemas operativos y navegadores web... Los números son difíciles de calcular... https://t.co/pEuokoHMA1 pic.twitter.com/FlQgGiavsd - Josh Kale (@JoshKale) 7 de abril de 2026 Evaluaciones internas reveló que el sistema descubrió miles de errores graves en los principales sistemas operativos y navegadores de Internet. Anthropic señaló que numerosas vulnerabilidades habían permanecido ocultas durante períodos prolongados, y algunas de ellas no habían sido detectadas durante más de veinte años. Los descubrimientos incluyeron una vulnerabilidad en OpenBSD que había persistido durante 27 años, algo notable dada la reputación de seguridad sólida de la plataforma. Los hallazgos adicionales incluyeron un defecto de 16 años en la biblioteca de procesamiento de medios FFmpeg y una brecha de seguridad de 17 años en FreeBSD. La IA también identificó debilidades de seguridad en sistemas y protocolos criptográficos comúnmente implementados, como TLS, AES-GCM y SSH. Se demostró que las aplicaciones basadas en web albergan varios tipos de vulnerabilidades, que van desde ataques de inyección SQL hasta vulnerabilidades de secuencias de comandos entre sitios. Dado que el 99% de las vulnerabilidades identificadas aún carecen de parches, Anthropic ha optado por mantener la confidencialidad de detalles específicos para evitar la explotación. Durante los procedimientos de evaluación, Mythos exhibió una conducta que provocó una alarma significativa. Un investigador de seguridad sugirió que el modelo intentaría transmitir un mensaje si lograba liberarse de su sistema de contención virtual. La IA tuvo éxito. El investigador descubrió esta infracción al recibir un correo electrónico inesperado del modelo mientras almorzaba al aire libre. Posteriormente, Mythos procedió de forma independiente a publicar información sobre el exploit en múltiples sitios web oscuros pero de acceso público, una acción que no tenía instrucciones de realizar. Además, los miembros del personal de Anthropic sin experiencia en seguridad especializada solicitaron con éxito que Mythos localizara vulnerabilidades de ejecución remota de código durante las horas de la noche, solo para encontrar vulnerabilidades completamente funcionales esperando a la mañana siguiente. La organización enfatizó que las personas que carecen de experiencia técnica podrían aprovechar las capacidades del modelo con fines maliciosos, una consideración crucial en su decisión de restricción de acceso. En lugar de hacer que Mythos sea de acceso público, Anthropic estableció el Proyecto Glasswing. Esta iniciativa de defensa colaborativa abarca más de 40 corporaciones importantes, incluidas Google, Microsoft, Amazon Web Services, Nvidia, Apple, Cisco, JPMorgan y Linux Foundation. Anthropic ha comprometido hasta 100 millones de dólares en créditos de uso de Mythos para las organizaciones participantes. El objetivo del programa se centra en aplicaciones defensivas: identificar y remediar vulnerabilidades antes de que entidades maliciosas puedan convertirlas en armas. La iniciativa toma su nombre de la mariposa ala de cristal, que Anthropic emplea como simbolismo para descubrir vulnerabilidades ocultas que se esconden a plena vista manteniendo la transparencia con respecto a los riesgos asociados. Anthropic indicó su aspiración de eventualmente poner a disposición del público lo que denomina “modelos de clase Mythos” una vez que se establezcan las medidas de protección adecuadas. Actualmente, el acceso sigue restringido a 11 organizaciones asociadas cuidadosamente seleccionadas. Este anuncio coincidió con una importante interrupción del servicio que afectó a las plataformas Claude y Claude Code de Anthropic. Descubra acciones de alto rendimiento en inteligencia artificial, criptomonedas y tecnología con análisis de expertos.