Anthropic 今天宣布,将把自家最神秘的AI模型——Claude Mythos Preview——的访问权限,扩展到超过15个国家的150个新组织。

听起来像是一次普通的产品推广?不。

这150个组织,管理着电力、水务、医疗、通信和硬件系统。一次成功的网络攻击,可能影响超过1亿人。

他们不是在卖订阅,而是在全球最关键的数字基础设施上,部署一个前所未有的“AI安保”。而这场实验,刚刚发现了超过10000个高危漏洞。

Project Glasswing 的目标是保护全球最关键软件

当AI成为“首席漏洞官”

Project Glasswing听起来很美:用最尖端的AI,免费帮全球最重要的软件找漏洞。

今年4月,第一波约50个合作伙伴拿到了Claude Mythos Preview的内测资格。几周内,他们交出了一份惊人的成绩单:超过10000个高危或关键级别的安全漏洞被发现。

这数字意味着什么?意味着那些支撑着现代社会运转的代码地基,可能早就是千疮百孔。而过去,人类安全专家可能需要数年才能发现其中一部分。

现在,AI做到了,而且快得多。

“神话”模型:防御者的盾,攻击者的矛

Claude Mythos Preview的能力,是这一切的核心。

它不只能找漏洞,还能写补丁、做渗透测试、甚至用内存安全语言重写老旧代码。它就像一个全知全能的数字医生,既能诊断,也能手术。

但问题在于,Anthropic自己给出了一个令人不安的预测:

“在6到12个月内,我们预计许多其他AI公司将拥有Mythos级别的模型,并且他们可能在没有防止滥用的安全措施的情况下发布它们。”

这才是Glasswing项目背后真正的恐惧——免费的、强大的网络攻击工具,可能即将遍地开花。到那时,网络攻击会更频繁、更难以预测。

所以,Glasswing本质是一场“防御抢跑”。在恶意AI普及之前,先让防御者武装起来。

150个新组织:一场全球基建的“压力测试”

这次新加入的150个组织,覆盖超过15个国家,组成了一个庞大的“关键基础设施联盟”。

他们的共同点是:攻击他们,后果将是灾难性的。

行业覆盖从最初的软件公司,扩展到了:

  • 能源与水务
  • 医疗健康
  • 通信网络
  • 硬件供应链

更重要的是,许多新伙伴是“供应商”——他们的代码被全球大量组织(包括政府)依赖。这意味着,一个漏洞可能像数字病毒一样,在全球系统中连锁传播

有意思的是,评论区一针见血:

“Glasswing项目只是Anthropic礼貌地表达:我们的遗留代码库是一个巨大的国家安全威胁。”

补丁,才是真正的战场

发现漏洞只是第一步。真正的瓶颈,在于修复。

想象一下:AI一天找到100个漏洞,但人类团队可能一个月才能修复其中10个。漏洞堆积如山,防御反而可能变得更糟。

所以,Glasswing的下一阶段,是从“发现”转向“修复”:

  1. 让AI写补丁合作伙伴已开始用Mythos Preview直接编写修复代码。
  2. 标准化漏洞报告与开源维护者合作,让漏洞报告更容易处理和行动。
  3. 规模化审查正在与第三方商讨,如何大规模审查和修补开源软件漏洞。

Anthropic的野心是改变整个流程:从一次性扫描,到持续的“发现-披露-修复-部署”安全闭环。

未完成的实验:我们到底在害怕什么?

然而,最大的悖论依然存在:如何安全地释放一个能力太强的工具?

Anthropic承认,要防止Mythos级别的能力被滥用,需要“非常强大的保障措施”——而“我们(以及据我们所知所有其他AI开发者)尚未开发出”这种措施。

所以,Glasswing目前只是一场“限定内测”。一个小心翼翼的、在受控环境中进行的实验。

它教会Anthropic(和整个行业)的,是如何应对模型跨过重要能力阈值的时刻。但这更像是一次预演,而非终极解决方案。

评论区的MikroJaxi说得精辟:

“前沿AI的真正考验不是基准测试,而是机构是否能够大规模负责任地使用它。”

这场全球“数字基建”的安保升级,才刚刚开始。Anthropic希望能为防御者赢得永久优势。

但另一个问题也随之浮现:当攻击者的AI同样强大时,这场防御与攻击的无限战争,真的有终点吗?

【锐评】:用AI给全球数字基建“打补丁”,听起来像是用消防队去扑灭一座随时可能喷发的火山。问题在于,火山本身,可能就是AI帮忙造的。

参考链接:
https://x.com/AnthropicAI/status/2061796327986454883