Anthropic 今天宣布,将把自家最神秘的AI模型——Claude Mythos Preview——的访问权限,扩展到超过15个国家的150个新组织。
听起来像是一次普通的产品推广?不。
这150个组织,管理着电力、水务、医疗、通信和硬件系统。一次成功的网络攻击,可能影响超过1亿人。
他们不是在卖订阅,而是在全球最关键的数字基础设施上,部署一个前所未有的“AI安保”。而这场实验,刚刚发现了超过10000个高危漏洞。

当AI成为“首席漏洞官”
Project Glasswing听起来很美:用最尖端的AI,免费帮全球最重要的软件找漏洞。
今年4月,第一波约50个合作伙伴拿到了Claude Mythos Preview的内测资格。几周内,他们交出了一份惊人的成绩单:超过10000个高危或关键级别的安全漏洞被发现。
这数字意味着什么?意味着那些支撑着现代社会运转的代码地基,可能早就是千疮百孔。而过去,人类安全专家可能需要数年才能发现其中一部分。
现在,AI做到了,而且快得多。
“神话”模型:防御者的盾,攻击者的矛
Claude Mythos Preview的能力,是这一切的核心。
它不只能找漏洞,还能写补丁、做渗透测试、甚至用内存安全语言重写老旧代码。它就像一个全知全能的数字医生,既能诊断,也能手术。
但问题在于,Anthropic自己给出了一个令人不安的预测:
“在6到12个月内,我们预计许多其他AI公司将拥有Mythos级别的模型,并且他们可能在没有防止滥用的安全措施的情况下发布它们。”
这才是Glasswing项目背后真正的恐惧——免费的、强大的网络攻击工具,可能即将遍地开花。到那时,网络攻击会更频繁、更难以预测。
所以,Glasswing本质是一场“防御抢跑”。在恶意AI普及之前,先让防御者武装起来。
150个新组织:一场全球基建的“压力测试”
这次新加入的150个组织,覆盖超过15个国家,组成了一个庞大的“关键基础设施联盟”。
他们的共同点是:攻击他们,后果将是灾难性的。
行业覆盖从最初的软件公司,扩展到了:
- 能源与水务
- 医疗健康
- 通信网络
- 硬件供应链
更重要的是,许多新伙伴是“供应商”——他们的代码被全球大量组织(包括政府)依赖。这意味着,一个漏洞可能像数字病毒一样,在全球系统中连锁传播。
有意思的是,评论区一针见血:
“Glasswing项目只是Anthropic礼貌地表达:我们的遗留代码库是一个巨大的国家安全威胁。”
补丁,才是真正的战场
发现漏洞只是第一步。真正的瓶颈,在于修复。
想象一下:AI一天找到100个漏洞,但人类团队可能一个月才能修复其中10个。漏洞堆积如山,防御反而可能变得更糟。
所以,Glasswing的下一阶段,是从“发现”转向“修复”:
- 让AI写补丁:合作伙伴已开始用Mythos Preview直接编写修复代码。
- 标准化漏洞报告:与开源维护者合作,让漏洞报告更容易处理和行动。
- 规模化审查:正在与第三方商讨,如何大规模审查和修补开源软件漏洞。
Anthropic的野心是改变整个流程:从一次性扫描,到持续的“发现-披露-修复-部署”安全闭环。
未完成的实验:我们到底在害怕什么?
然而,最大的悖论依然存在:如何安全地释放一个能力太强的工具?
Anthropic承认,要防止Mythos级别的能力被滥用,需要“非常强大的保障措施”——而“我们(以及据我们所知所有其他AI开发者)尚未开发出”这种措施。
所以,Glasswing目前只是一场“限定内测”。一个小心翼翼的、在受控环境中进行的实验。
它教会Anthropic(和整个行业)的,是如何应对模型跨过重要能力阈值的时刻。但这更像是一次预演,而非终极解决方案。
评论区的MikroJaxi说得精辟:
“前沿AI的真正考验不是基准测试,而是机构是否能够大规模负责任地使用它。”
这场全球“数字基建”的安保升级,才刚刚开始。Anthropic希望能为防御者赢得永久优势。
但另一个问题也随之浮现:当攻击者的AI同样强大时,这场防御与攻击的无限战争,真的有终点吗?
【锐评】:用AI给全球数字基建“打补丁”,听起来像是用消防队去扑灭一座随时可能喷发的火山。问题在于,火山本身,可能就是AI帮忙造的。
参考链接:
https://x.com/AnthropicAI/status/2061796327986454883