说实话,我很少见到一份科技文档能像 Anthropic 刚刚发布的 Mythos 系统卡片这样,把“皇帝的新衣”穿得如此隆重,又碎得如此彻底。
就在几天前,这家 AI 巨头还在警告全世界:他们的新模型 Claude Mythos 太危险了,发现了“数千个”高危零日漏洞,甚至“吓坏了英国人”。为了“保卫人类”,他们甚至拉来了微软、谷歌、亚马逊等一众巨头,搞了个 1 亿美元的“玻璃翼”防御计划。
听起来是不是像极了好莱坞大片?可惜,剧本写得再好,也怕较真的观众。当我耐着性子翻完那 244 页的报告,却发现了一个让人哭笑不得的事实:这 244 页里,真正讲网络安全的只有 7 页。
更讽刺的是,这 7 页里不仅没有“数千个”漏洞的影子,甚至连最基本的安全术语都找不到。一场看似理性的技术发布,背后竟是一场精心编织的数据游戏。
一场精心策划的“狼来了”
先来看看 Anthropic 是怎么吓唬大家的。
媒体铺天盖地地引用:“数千个零日漏洞,覆盖所有主流操作系统和浏览器”。听起来是不是感觉世界末日要来了?
但我翻遍了那份被吹上天的技术报告,那个“数千”的词,在 244 页里只出现了一次——还不是用来形容漏洞数量的。真正的安全章节(第 47-53 页),既没有 CVE 编号,没有漏洞严重等级分布,甚至找不到“Fuzzer”(模糊测试)这个词。
这就好比一份夏威夷旅游手册,通篇不提海滩,只告诉你“风景很美”。
老实讲,这种“营销喊口号,文档玩失踪”的做法,实在让人难以信任。 那个吓人的“数千个漏洞”,只活在营销博客和公关稿里,一旦到了需要负责任的技术文档里,就立刻隐身了。
考场里的“作弊者”
如果只是文档注水也就算了,更离谱的是他们的“旗舰演示”。
Anthropic 拿出了一个 Firefox 浏览器的漏洞利用案例,号称成功率高达 72.4%。这个数字被媒体疯狂转载,成了 Mythos “前所未有威胁”的铁证。
但真相往往藏在脚注里。
首先,这个测试环境根本不是真实的 Firefox 浏览器。他们把浏览器的沙箱、防御机制统统拆掉了,只在一个裸奔的 JavaScript 引擎里跑测试。这就好比把一个拳击手绑在椅子上,然后宣称自己打赢了世界冠军。
更尴尬的还在后面。那 50 个用来测试的漏洞,根本不是 Mythos 发现的,而是它的上一代模型 Opus 4.6 早就找出来的。Mythos 只是在“开卷考试”里,拿着别人给的答案做了一遍。
最致命的一击来自他们自己的数据图表(Figure 3.3.3.B)。当你把其中两个最容易利用的“送分题”拿掉后,Mythos 的成功率直接从 72.4% 暴跌到了 4.4%。
看懂了吗?所谓的“前所未有”,全靠两个特定的漏洞撑场面。一旦没了这两个“托儿”,它的表现和前代模型几乎没区别。这就是他们口中的“文明级威胁”?
拆穿西洋镜:只需11美分
如果这还不够荒谬,那么接下来的事情简直就是公开处刑。
一家名为 AISLE 的安全初创公司,做了一个非常简单的实验:他们找来几个开源的小模型,去验证 Anthropic 炫耀的那几个“独家”漏洞。
结果呢?一个参数量仅 3.6B、运行成本只要 0.11 美元/百万 token 的开源模型,成功找到了 Anthropic 用来撑门面的那个 FreeBSD 漏洞。
这说明了什么?说明 Anthropic 用来证明自己“太危险不能发布”的核心能力,其实是任何一个小模型都能以白菜价复现的“大路货”。
那个售价 25 美元/百万 token 的“神话”,在 11 美分的开源模型面前,瞬间失去了光环。 个人觉得,这恐怕才是他们不敢公开对比基准测试的真正原因。
一亿美元的“空气大饼”
既然技术没那么神,那钱呢?
Anthropic 宣布投入 1 亿美元搞“玻璃翼”防御计划。听起来很豪横?拆开看你会发现,真正的现金只有 400 万美元捐款,剩下的 1 亿美元全是 API 使用额度。
这就是典型的“拿自己的饭票当饭吃”。他们让合作伙伴用这些额度去跑模型,然后产生的“验证数据”再反过来证明模型的价值。这是一个完美的闭环,但唯独没有真金白银的投入。
更有意思的是,那些背书的巨头们——微软、谷歌、CrowdStrike,没有一家具体确认过哪怕一个漏洞。他们的声明里全是“合作机会”、“行业责任”这类正确的废话。这哪里是技术背书,分明就是一场互相站台的品牌秀。
结语
说到底,Mythos 展现的并不是技术的恐怖,而是营销的恐怖。
Anthropic 试图建立一个逻辑:因为模型太危险,所以不能公开发布,只能通过我们选定的“精英俱乐部”来使用。这根本不是为了安全,这是在建立私有的“漏洞话语权”,甚至是在搞监管捕获。
一个连打补丁的系统都攻不破、离开“送分题”就现原形的模型,被包装成了终结者。而真正让我感到脊背发凉的,不是 AI 有多强,而是我们如此轻易地相信了这场神话。
在这个时代,制造恐慌,似乎比制造技术要容易得多,也划算得多。
【锐评】:把“开卷考试”吹成“神童下凡”,把“营销额度”包装成“防御基金”,Anthropic 这波操作与其说是技术突破,不如说是对公众智商的极限施压测试。
参考链接:
https://www.flyingpenguin.com/the-boy-that-cried-mythos-verification-is-collapsing-trust-in-anthropic/