244页报告藏着惊天骗局？Anthropic新模型神话，24小时内被扒得底裤都不剩

说实话，我很少见到一份科技文档能像 Anthropic 刚刚发布的 Mythos 系统卡片这样，把“皇帝的新衣”穿得如此隆重，又碎得如此彻底。

就在几天前，这家 AI 巨头还在警告全世界：他们的新模型 Claude Mythos 太危险了，发现了“数千个”高危零日漏洞，甚至“吓坏了英国人”。为了“保卫人类”，他们甚至拉来了微软、谷歌、亚马逊等一众巨头，搞了个 1 亿美元的“玻璃翼”防御计划。

听起来是不是像极了好莱坞大片？可惜，剧本写得再好，也怕较真的观众。当我耐着性子翻完那 244 页的报告，却发现了一个让人哭笑不得的事实：这 244 页里，真正讲网络安全的只有 7 页。

更讽刺的是，这 7 页里不仅没有“数千个”漏洞的影子，甚至连最基本的安全术语都找不到。一场看似理性的技术发布，背后竟是一场精心编织的数据游戏。

一场精心策划的“狼来了”

AI配图

先来看看 Anthropic 是怎么吓唬大家的。

媒体铺天盖地地引用：“数千个零日漏洞，覆盖所有主流操作系统和浏览器”。听起来是不是感觉世界末日要来了？

但我翻遍了那份被吹上天的技术报告，那个“数千”的词，在 244 页里只出现了一次——还不是用来形容漏洞数量的。真正的安全章节（第 47-53 页），既没有 CVE 编号，没有漏洞严重等级分布，甚至找不到“Fuzzer”（模糊测试）这个词。

AI配图

这就好比一份夏威夷旅游手册，通篇不提海滩，只告诉你“风景很美”。

老实讲，这种“营销喊口号，文档玩失踪”的做法，实在让人难以信任。 那个吓人的“数千个漏洞”，只活在营销博客和公关稿里，一旦到了需要负责任的技术文档里，就立刻隐身了。

如果只是文档注水也就算了，更离谱的是他们的“旗舰演示”。

Anthropic 拿出了一个 Firefox 浏览器的漏洞利用案例，号称成功率高达 72.4%。这个数字被媒体疯狂转载，成了 Mythos “前所未有威胁”的铁证。

但真相往往藏在脚注里。

首先，这个测试环境根本不是真实的 Firefox 浏览器。他们把浏览器的沙箱、防御机制统统拆掉了，只在一个裸奔的 JavaScript 引擎里跑测试。这就好比把一个拳击手绑在椅子上，然后宣称自己打赢了世界冠军。

更尴尬的还在后面。那 50 个用来测试的漏洞，根本不是 Mythos 发现的，而是它的上一代模型 Opus 4.6 早就找出来的。Mythos 只是在“开卷考试”里，拿着别人给的答案做了一遍。

最致命的一击来自他们自己的数据图表（Figure 3.3.3.B）。当你把其中两个最容易利用的“送分题”拿掉后，Mythos 的成功率直接从 72.4% 暴跌到了 4.4%。

看懂了吗？所谓的“前所未有”，全靠两个特定的漏洞撑场面。一旦没了这两个“托儿”，它的表现和前代模型几乎没区别。这就是他们口中的“文明级威胁”？

如果这还不够荒谬，那么接下来的事情简直就是公开处刑。

一家名为 AISLE 的安全初创公司，做了一个非常简单的实验：他们找来几个开源的小模型，去验证 Anthropic 炫耀的那几个“独家”漏洞。

结果呢？一个参数量仅 3.6B、运行成本只要 0.11 美元/百万 token 的开源模型，成功找到了 Anthropic 用来撑门面的那个 FreeBSD 漏洞。

这说明了什么？说明 Anthropic 用来证明自己“太危险不能发布”的核心能力，其实是任何一个小模型都能以白菜价复现的“大路货”。

那个售价 25 美元/百万 token 的“神话”，在 11 美分的开源模型面前，瞬间失去了光环。 个人觉得，这恐怕才是他们不敢公开对比基准测试的真正原因。

既然技术没那么神，那钱呢？

Anthropic 宣布投入 1 亿美元搞“玻璃翼”防御计划。听起来很豪横？拆开看你会发现，真正的现金只有 400 万美元捐款，剩下的 1 亿美元全是 API 使用额度。

这就是典型的“拿自己的饭票当饭吃”。他们让合作伙伴用这些额度去跑模型，然后产生的“验证数据”再反过来证明模型的价值。这是一个完美的闭环，但唯独没有真金白银的投入。

AI配图

更有意思的是，那些背书的巨头们——微软、谷歌、CrowdStrike，没有一家具体确认过哪怕一个漏洞。他们的声明里全是“合作机会”、“行业责任”这类正确的废话。这哪里是技术背书，分明就是一场互相站台的品牌秀。

说到底，Mythos 展现的并不是技术的恐怖，而是营销的恐怖。

Anthropic 试图建立一个逻辑：因为模型太危险，所以不能公开发布，只能通过我们选定的“精英俱乐部”来使用。这根本不是为了安全，这是在建立私有的“漏洞话语权”，甚至是在搞监管捕获。

一个连打补丁的系统都攻不破、离开“送分题”就现原形的模型，被包装成了终结者。而真正让我感到脊背发凉的，不是 AI 有多强，而是我们如此轻易地相信了这场神话。

在这个时代，制造恐慌，似乎比制造技术要容易得多，也划算得多。

【锐评】：把“开卷考试”吹成“神童下凡”，把“营销额度”包装成“防御基金”，Anthropic 这波操作与其说是技术突破，不如说是对公众智商的极限施压测试。

参考链接：
https://www.flyingpenguin.com/the-boy-that-cried-mythos-verification-is-collapsing-trust-in-anthropic/