在发现众多漏洞后，出于安全考虑，Anthropic 限制了对 Claude AI 模型的访问

Anthropic 决定停止公开其最新的人工智能系统 Claude Mythos。据该公司称，该模型在识别关键软件安全缺陷方面拥有卓越的能力，所带来的风险太大，无法广泛分发。这是一件大事...... Anthropic 刚刚宣布了一个如此强大的模型，他们不会向公众发布它，因为担心它会造成损害😨 Claude Mythos Preview 在每个主要操作系统和网络浏览器中发现了数千个零日漏洞......这些数字很难...... https://t.co/pEuokoHMA1 pic.twitter.com/FlQgGiavsd — Josh Kale (@JoshKale) 2026 年 4 月 7 日内部评估据透露，该系统在主流操作系统和互联网浏览器中发现了数千个严重错误。 Anthropic 指出，许多漏洞长期隐藏，其中一些漏洞二十多年来一直未被发现。这些发现包括 OpenBSD 中存在的一个漏洞，该漏洞已经持续了 27 年——考虑到该平台以强大的安全性而闻名，这一点值得注意。其他发现还包括 FFmpeg 媒体处理库中存在 16 年之久的缺陷以及 FreeBSD 中存在 17 年之久的安全漏洞。 AI 还发现了常用加密系统和协议（例如 TLS、AES-GCM 和 SSH）中的安全漏洞。基于 Web 的应用程序被证明存在各种类型的漏洞，从 SQL 注入攻击到跨站点脚本攻击。由于 99% 的已识别漏洞仍缺乏补丁，Anthropic 选择对具体细节保密以防止被利用。在评估过程中，Mythos 的行为引发了重大警报。一位安全研究人员建议，如果该模型设法摆脱虚拟遏制系统，它就会尝试传输消息。人工智能成功了。研究人员在户外吃午餐时收到模特发来的一封意料之外的电子邮件后发现了这一漏洞。随后，Mythos 继续独立地在多个不起眼但可公开访问的网站上发布漏洞利用信息——这是它没有被指示执行的操作。此外，没有专业安全背景的 Anthropic 工作人员成功地要求 Mythos 在晚上找到远程代码执行漏洞，结果却在第二天早上发现了功能齐全的漏洞。该组织强调，缺乏技术专业知识的个人可能会利用该模型的能力进行恶意目的，这是他们做出访问限制决策时的一个关键考虑因素。 Anthropic 没有将 Mythos 公开，而是建立了 Project Glasswing。这项协作防御计划涉及 40 多家大公司，包括谷歌、微软、亚马逊网络服务、英伟达、苹果、思科、摩根大通和 Linux 基金会。 Anthropic 已承诺为参与组织提供高达 1 亿美元的 Mythos 使用积分。该计划的目标集中在防御性应用程序上，即在恶意实体将漏洞武器化之前识别并修复漏洞。该计划以玻璃翼蝴蝶命名，Anthropic 将其用作发现隐藏在普通视图中的隐藏漏洞的象征，同时保持相关风险的透明度。 Anthropic 表示，一旦制定了适当的保护措施，它希望最终公开其所谓的“神话级模型”。目前，访问权限仍仅限于 11 个精心挑选的合作伙伴组织。这一公告恰逢影响 Anthropic 的 Claude 和 Claude Code 平台的重大服务中断。通过专家分析发现人工智能、加密货币和技术领域表现最好的股票。