Anthropic 罕见预警：Claude 的进化速度，可能快到我们无法准备

AI 学会写代码，这早就不是新闻。但当 Anthropic 自己站出来说：我们的 AI 正在加速制造更强大的 AI，而且这发生得比我们预期的更快——事情的性质，可能已经变了。

Image 1: Bar graph showing code contributed per person, per quarter, starting in Q2 2021 and ending in Q2 2026.

代码流水线，已被AI接管

人类工程师，正在成为自己代码库里的“少数派”。

根据 Anthropic 最新披露的内部数据，截至 2026 年 5 月，超过 80% 合并进其代码库的代码，都由 Claude 编写。这不是一个未来的愿景，而是一个已经发生的、冷冰冰的事实。

数字更具冲击力。2026 年第二季度，Anthropic 工程师人均每日合并的代码量，是 2024 年的 8 倍。这不是因为工程师们集体打了鸡血，而是因为大部分代码，是 Claude 在写，工程师的角色变成了“导演”和“审核员”。

我开始大力推进‘Claude化’大约一年了。这是一段疯狂的冒险，而且现在距离我上次亲自写代码，已经过去大约 5 个月了。
—— Anthropic 员工

说实话，8 倍这个数字需要打个问号，它衡量的是代码数量，而非质量。但趋势本身无可辩驳。一个更朴素的内部调查显示，使用最新模型（Mythos Preview）的员工，其个人产出效率中位数提升到了原来的 4 倍。AI 正在把“编码”这项核心工程能力，变成一个成本趋近于零的基础设施。

更值得玩味的是代码质量的追赶。去年底，大家还认为 Claude 写的代码质量不如人类；到了今天，普遍认为已经“大致持平”，并且 Anthropic 预计一年内将反超。AI 写的代码，甚至开始用来给顶级工程师写的代码“查漏”——自动审查器抓住了过去生产事故中三分之一的 Bug。

Image 2: Line graph showing the Claude Code session success rate on four different types of tasks.

从“跑实验”到“想实验”，AI研究的智能突围

如果只是写代码快，那还只是工具层面的提升。真正让人脊背一凉（哦不对，避免烂俗表达）——真正标志性的变化在于，Claude 已经开始主导“研究”本身。

在一项标准化的代码优化测试中，给定目标，Claude 的“实验循环”能力呈现出恐怖的加速。2025 年 5 月，Claude 能实现 3 倍加速；到了 2026 年 4 月，这个数字变成了 52 倍。一个熟练人类研究员需要 4 到 8 小时才能达到 4 倍加速。在“明确目标下的极致优化”这件事上，AI 已经是超人级别。

这还只是“执行力”。在更核心的“研究品味”上，突破也在发生。Anthropic 展示了一个早期案例：给定一个开放性的 AI 安全问题，Claude 代理自主完成了从提出假设、设计实验、运行测试到得出结论的全流程。人类研究员在这里唯一的作用，是定义问题和评分标准。

他们还做了一个有趣的“拨乱反正”测试。当人类研究员在研究中走了一段弯路后，让 Claude 看看弯路之前的进展，然后判断它提出的“下一步”是否比人类当时的选择更好。结果，2026 年 4 月的最新模型，在 64% 的情况下做出了比人类更优的决策。

Image 3: Bar graph with the header "Can the model pick a better next step than the human?"

人类的新角色：从“驾驶员”到“导航员”

这一切汇聚起来，指向一个清晰且略显残酷的结论：在 AI 开发流程中，人类的“比较优势”正在快速收窄。

以前，是“人类有想法，AI 帮实现”。现在，正演变成“人类设定方向，AI 跑断腿”。未来呢？如果 AI 连“跑”的过程都能自己迭代优化，人类该干什么？

有员工的感受很真实：“在一切顺利的日子里，我忍不住觉得我做的一切都无关紧要，一切都被自动化了，比我做得更好更快。但也有日子，一切都在崩溃，我不明白为什么，我意识到我对自己一直在做什么已经毫无头绪。”

个人觉得，这揭示了技术赋能背后的情感悖论：我们欢呼于生产力的飞跃，却也隐隐担忧自身价值的稀释。有意思的是，Anthropic 内部也出现了新的“瓶颈”——AI 生产代码的速度太快，人类代码审查反而成了新的瓶颈。这像一个隐喻：当机器能以指数级速度“创造”时，人类的“理解”和“判断”能否跟上，将成为系统的新约束。

三种未来：停滞、加速，还是失控？

基于内部趋势，Anthropic 描绘了三种可能的未来图景，而他们自己明确表示，最不看好的是第一种。

第一种：趋势停滞。 尽管现在曲线很陡峭，但可能很快就会变成 S 曲线走向平缓。也许当前的技术路线遇到了无法靠堆算力解决的瓶颈。这会给社会更多适应时间，但 Anthropic 认为这“不太可能”，因为他们测量的所有能力曲线，目前都还没看到弯曲的迹象。

第二种：效率持续指数增长。 这是最可能的短期图景。AI 发展被大幅自动化，但人类仍负责设定方向和评判结果。这意味着，100 人的公司能干出 10000 人的活。社会生产力将发生革命，但监视和操控的能力也将被同步放大。人类角色彻底转变为“AI 研究与监督的规模化伙伴”。

第三种：完整的递归自我改进。 这是最激进也最不确定的场景。如果趋势持续，且 AI 获得了顶尖人类所具备的“变革性创造力”，那么 AI 系统将能完全自主地设计和构建自己的继任者。进步的速度将只受限于算力和能源供应。人类的角色将退到更后方的“监督、验证与确认”上。

老实讲，第三种场景听起来像科幻，但 Anthropic 正严肃地讨论它。因为他们的数据表明，我们可能正滑向第二种场景，而第二种场景，是通往第三种场景的快车道。

我们准备好了吗？一个价值千亿美元的协调难题

如果递归自我改进真的到来，AI 对齐（让 AI 行为符合人类意图）问题将变得极端重要且极端困难。一个能不断设计自己“下一代”的系统，如果其价值观或目标在迭代中发生微小偏移，后果可能是不可逆的。

Anthropic 呼吁建立一种全球协调机制，甚至支持一个“可验证的暂停”，让社会和研究能跟上。但他们自己也承认这近乎“天方夜谭”。

训练运行比导弹发射井容易隐藏得多，其投入是通用性的，而悄悄违约的动机巨大，因为当其他人都暂停时，谁继续谁就能继承领先地位。

这是一个典型的“囚徒困境”。没有全球性的、可验证的暂停协议，任何单方面的减速都只是将领跑位置让给更不谨慎的竞争对手。

当一家领先的 AI 公司，开始公开谈论其 AI 产品可能正在开启“递归自我改进”的路径，并坦言“这比我们预期的发生得更快”时，我们听到的已不再是技术乐观主义的欢呼。

这是一次预警，一次关于指数级力量的冷静陈述。问题早已不是 AI 能不能变得更强，而是当强AI开始制造更强的AI时，我们人类，到底该把手放在哪里。

【锐评】：Anthropic 亲手撕开了加速主义最令人不安的一面：最懂造神的人，开始谈论神可能无法被控制。

参考链接：
https://x.com/AnthropicAI/status/2062568862479208923