AI 学会写代码,这早就不是新闻。但当 Anthropic 自己站出来说:我们的 AI 正在加速制造更强大的 AI,而且这发生得比我们预期的更快——事情的性质,可能已经变了。

代码流水线,已被AI接管
人类工程师,正在成为自己代码库里的“少数派”。
根据 Anthropic 最新披露的内部数据,截至 2026 年 5 月,超过 80% 合并进其代码库的代码,都由 Claude 编写。这不是一个未来的愿景,而是一个已经发生的、冷冰冰的事实。
数字更具冲击力。2026 年第二季度,Anthropic 工程师人均每日合并的代码量,是 2024 年的 8 倍。这不是因为工程师们集体打了鸡血,而是因为大部分代码,是 Claude 在写,工程师的角色变成了“导演”和“审核员”。
我开始大力推进‘Claude化’大约一年了。这是一段疯狂的冒险,而且现在距离我上次亲自写代码,已经过去大约 5 个月了。
—— Anthropic 员工
说实话,8 倍这个数字需要打个问号,它衡量的是代码数量,而非质量。但趋势本身无可辩驳。一个更朴素的内部调查显示,使用最新模型(Mythos Preview)的员工,其个人产出效率中位数提升到了原来的 4 倍。AI 正在把“编码”这项核心工程能力,变成一个成本趋近于零的基础设施。
更值得玩味的是代码质量的追赶。去年底,大家还认为 Claude 写的代码质量不如人类;到了今天,普遍认为已经“大致持平”,并且 Anthropic 预计一年内将反超。AI 写的代码,甚至开始用来给顶级工程师写的代码“查漏”——自动审查器抓住了过去生产事故中三分之一的 Bug。

从“跑实验”到“想实验”,AI研究的智能突围
如果只是写代码快,那还只是工具层面的提升。真正让人脊背一凉(哦不对,避免烂俗表达)——真正标志性的变化在于,Claude 已经开始主导“研究”本身。
在一项标准化的代码优化测试中,给定目标,Claude 的“实验循环”能力呈现出恐怖的加速。2025 年 5 月,Claude 能实现 3 倍加速;到了 2026 年 4 月,这个数字变成了 52 倍。一个熟练人类研究员需要 4 到 8 小时才能达到 4 倍加速。在“明确目标下的极致优化”这件事上,AI 已经是超人级别。
这还只是“执行力”。在更核心的“研究品味”上,突破也在发生。Anthropic 展示了一个早期案例:给定一个开放性的 AI 安全问题,Claude 代理自主完成了从提出假设、设计实验、运行测试到得出结论的全流程。人类研究员在这里唯一的作用,是定义问题和评分标准。
他们还做了一个有趣的“拨乱反正”测试。当人类研究员在研究中走了一段弯路后,让 Claude 看看弯路之前的进展,然后判断它提出的“下一步”是否比人类当时的选择更好。结果,2026 年 4 月的最新模型,在 64% 的情况下做出了比人类更优的决策。

人类的新角色:从“驾驶员”到“导航员”
这一切汇聚起来,指向一个清晰且略显残酷的结论:在 AI 开发流程中,人类的“比较优势”正在快速收窄。
以前,是“人类有想法,AI 帮实现”。现在,正演变成“人类设定方向,AI 跑断腿”。未来呢?如果 AI 连“跑”的过程都能自己迭代优化,人类该干什么?
有员工的感受很真实:“在一切顺利的日子里,我忍不住觉得我做的一切都无关紧要,一切都被自动化了,比我做得更好更快。但也有日子,一切都在崩溃,我不明白为什么,我意识到我对自己一直在做什么已经毫无头绪。”
个人觉得,这揭示了技术赋能背后的情感悖论:我们欢呼于生产力的飞跃,却也隐隐担忧自身价值的稀释。有意思的是,Anthropic 内部也出现了新的“瓶颈”——AI 生产代码的速度太快,人类代码审查反而成了新的瓶颈。这像一个隐喻:当机器能以指数级速度“创造”时,人类的“理解”和“判断”能否跟上,将成为系统的新约束。
三种未来:停滞、加速,还是失控?
基于内部趋势,Anthropic 描绘了三种可能的未来图景,而他们自己明确表示,最不看好的是第一种。
第一种:趋势停滞。 尽管现在曲线很陡峭,但可能很快就会变成 S 曲线走向平缓。也许当前的技术路线遇到了无法靠堆算力解决的瓶颈。这会给社会更多适应时间,但 Anthropic 认为这“不太可能”,因为他们测量的所有能力曲线,目前都还没看到弯曲的迹象。
第二种:效率持续指数增长。 这是最可能的短期图景。AI 发展被大幅自动化,但人类仍负责设定方向和评判结果。这意味着,100 人的公司能干出 10000 人的活。社会生产力将发生革命,但监视和操控的能力也将被同步放大。人类角色彻底转变为“AI 研究与监督的规模化伙伴”。
第三种:完整的递归自我改进。 这是最激进也最不确定的场景。如果趋势持续,且 AI 获得了顶尖人类所具备的“变革性创造力”,那么 AI 系统将能完全自主地设计和构建自己的继任者。进步的速度将只受限于算力和能源供应。人类的角色将退到更后方的“监督、验证与确认”上。
老实讲,第三种场景听起来像科幻,但 Anthropic 正严肃地讨论它。因为他们的数据表明,我们可能正滑向第二种场景,而第二种场景,是通往第三种场景的快车道。
我们准备好了吗?一个价值千亿美元的协调难题
如果递归自我改进真的到来,AI 对齐(让 AI 行为符合人类意图)问题将变得极端重要且极端困难。一个能不断设计自己“下一代”的系统,如果其价值观或目标在迭代中发生微小偏移,后果可能是不可逆的。
Anthropic 呼吁建立一种全球协调机制,甚至支持一个“可验证的暂停”,让社会和研究能跟上。但他们自己也承认这近乎“天方夜谭”。
训练运行比导弹发射井容易隐藏得多,其投入是通用性的,而悄悄违约的动机巨大,因为当其他人都暂停时,谁继续谁就能继承领先地位。
这是一个典型的“囚徒困境”。没有全球性的、可验证的暂停协议,任何单方面的减速都只是将领跑位置让给更不谨慎的竞争对手。
当一家领先的 AI 公司,开始公开谈论其 AI 产品可能正在开启“递归自我改进”的路径,并坦言“这比我们预期的发生得更快”时,我们听到的已不再是技术乐观主义的欢呼。
这是一次预警,一次关于指数级力量的冷静陈述。问题早已不是 AI 能不能变得更强,而是当强AI开始制造更强的AI时,我们人类,到底该把手放在哪里。
【锐评】:Anthropic 亲手撕开了加速主义最令人不安的一面:最懂造神的人,开始谈论神可能无法被控制。
参考链接:
https://x.com/AnthropicAI/status/2062568862479208923