不受限制地访问人工智能编码引发了关于社区驱动的监督边界的争论。

根据《金融时报》与人工智能安全组织 Alice 的测试,使用公开可用的工具可以在几分钟内删除主要技术组织开源人工智能模型的安全保护,从而使系统能够对包括生物武器、恶意软件和其他违禁内容在内的主题做出响应。
周一发布的调查结果加剧了人们的担忧,即一旦模型权重被发布和修改,开发人员嵌入的保护措施可能不会持续存在,这引发了关于人工智能安全责任应该由何处承担的问题。
这项调查使用公共代码存储库上提供的工具进行,发现 Meta 和 Google 等公司开发的模型上的护栏可以在 10 分钟内移除,无需专业硬件。
根据测试,系统的修改版本随后能够响应原始模型拒绝的提示,包括与恶意软件和化学危害相关的请求。
结果突显了政策制定者面临的挑战,因为开源系统变得更加强大且分布广泛。
与专有模型不同,开源系统可以在原始开发人员的控制之外进行下载、更改和重新分发,这使得发布后执行安全约束变得更加困难,并引发了主要针对模型开发的监管是否足够的问题。
治理限制
全球监管机构正在开发先进人工智能系统的框架,包括欧盟的人工智能法案以及英国和美国新兴的前沿模型安全方法。然而,专家表示,调查结果揭示了当前治理假设的局限性。
欧盟人工智能法案。资料来源:欧盟委员会
去中心化物理基础设施网络公司 XYO 的联合创始人马库斯·莱文 (Markus Levin) 告诉 Cointelegraph,安全措施的迅速取消表明“一旦开放模型发布,控制权转移的速度有多快”,并补充说大多数治理提案仍然过于关注模型构建阶段。
Olas 的创始成员兼 AI 代理平台 Valory 的首席执行官 David Minarsch 告诉 Cointelegraph,一旦权重在网上广泛反映,政府就不太可能阻止意志坚定的参与者访问或修改模型。他表示,如果重点关注部署、分发和有害的现实世界使用,而不是仅仅关注原始的开发人员层,监管将会更加有效。
控制权向下游移动
区块链安全公司 CertiK 的首席执行官兼联合创始人顾荣辉告诉 Cointelegraph,开发者层的治理仍然很重要,但一旦模型可以免费下载和重新分发,就变得不够了。
顾表示,政策制定者更有可能影响商业托管、企业部署和分销渠道,而不是完全阻止修改模型的传播。
他认为,安全标准必须不断发展,以在部署之前识别第三方人工智能工具和自主人工智能代理环境中的恶意或高风险行为,以便在代理承担更多自主角色时更好地遏制运行时威胁。
莱文表示,一旦模型被镜像和重新分配,遏制就会变得越来越困难,这意味着政策制定者可能需要更多地关注基础设施和分配点,而不仅仅是模型设计。
Levin 和 Minarsch 都将该问题与开源软件和加密网络进行了比较,历史证明,一旦代码公开可用,压制分发的尝试就会变得困难。米纳什补充说,虽然安全层可以阻止偶然的滥用,但它们不应被误认为是针对复杂行为者的强有力的保护。