说实话,看到 Anthropic 最新发布的这篇工程博客时,我第一反应是:这帮人真敢想。
他们居然把 Claude 的"大脑"从"身体"里硬生生切了出来。
这听起来有点像恐怖片,但实际上这是一次针对 AI Agent 架构的暴力重构。核心观点极其犀利:别把你的 Agent 当宠物养,要把它当牲口使。
为什么这么说?因为过去我们构建 Agent 的方式,从根本上就错了。
别给服务器当保姆
先问个扎心的问题:你有没有遇到过这种情况?
Agent 跑着跑着,容器挂了。然后你发现,不仅任务丢了,连调试窗口都没了。你只能像个保姆一样,对着一个死掉的容器发呆,试图搞清楚到底是代码 bug、网络丢包,还是单纯的环境抽风。
Anthropic 团队也踩了这个坑。
起初,他们把所有东西——会话、控制逻辑、沙箱环境——全塞进了一个容器里。好处显而易见:简单、直接、文件编辑就是系统调用。但坏处是致命的:你养了一只"宠物"。
在运维界有个经典比喻:宠物vs 牲口。宠物你得给它起名、精心照料、生了病得治;牲口则是无名的、可替换的,挂了就换一只。
Anthropic 发现,把 Agent 放在单一容器里,服务器就成了"宠物"。容器一旦失联,工程师就得钻进 Shell 里"抢救"。
更麻烦的是安全边界。在这个耦合架构里,Claude 生成的恶意代码和你的核心凭证(Token)住在同一个屋檐下。只要一个 Prompt 注入,攻击者就能顺手牵羊。
这哪是 Agent,简直是定时炸弹。
把脑子拿出来,单独存放
怎么解决?Anthropic 给出的方案简单粗暴:把"大脑"(Claude 和控制逻辑)和"手脚"(沙箱和工具)拆开。
这不仅仅是架构调整,简直是哲学升级。
1. Harness(控制逻辑)离开容器
以前,控制逻辑住在容器里;现在,它在外面调用容器。执行变成了简单的函数调用:execute(name, input) → string。
容器变成了"牲口"。挂了?Harness 捕获报错,Claude 决定重试,直接起个新容器。不用哄,不用救,换一个就行。
2. Session(会话日志)独立存在
这是最妙的一步。会话日志不再依附于容器,而是变成了一个独立的、只增不减的日志流。
Harness 崩了?没关系,日志还在。新 Harness 启动,调用 wake(sessionId) 读回日志,接着上次的地方继续干。这就像玩游戏有了云存档,主机炸了换个号接着打。
3. 安全边界彻底隔离
Token 再也不进沙箱了。无论是 Git 操作还是自定义工具,凭证都锁在 Vault 里,Claude 只能通过代理调用。沙箱里的代码再怎么折腾,也摸不到钥匙。
"上下文焦虑"与被淘汰的补丁
有意思的是,Anthropic 在文章里自曝了一个"翻车"细节。
之前他们发现 Claude Sonnet 4.5 有个毛病:一旦感知到上下文快满了,就会焦虑,然后草草结束任务。为了治这个"上下文焦虑",他们在控制逻辑里加了强制重置。
结果 Claude Opus 4.5 出来后,这毛病没了。
那些为了修补旧模型缺陷而设计的代码,瞬间变成了"死代码"。
这给行业敲了个警钟:别为了适配模型今天的缺陷,给架构打补丁。模型进化太快,补丁会变成累赘。
所以,Managed Agents 的设计逻辑是:只定义接口,不定义实现。Session 只负责存,Harness 只负责调度,至于中间怎么折腾,那是未来的事。
性能暴增 90% 的秘密
架构调整带来的副作用,竟然是性能暴涨。
以前,每次会话都要等容器启动、代码库克隆、进程启动……这一套下来,用户就在那干等首字延迟(TTFT)。
现在呢?大脑和手脚分家了。会话开始时,大脑直接启动,不需要沙箱就先不建。只有真正需要干活时,才去调 execute。
结果很吓人:p50 TTFT 降低约 60%,p95 降低超过 90%。
老实讲,这个数据比我预想的还要激进。这意味着用户几乎不用等,Claude 就能开始"思考"了。
为"尚未想到的程序"设计系统
Anthropic 在文中引用了一个计算机史上的经典命题:如何为"尚未想到的程序"设计系统?
几十年前,操作系统给出的答案是"抽象"。把硬件虚拟化成进程、文件这些概念。不管底下是 70 年代的磁盘还是现在的 SSD,read() 命令都一样。
Managed Agents 也是这个路子。他们把 Agent 虚拟化成了三个抽象:Session(记忆)、Harness(大脑)、Sandbox(手脚)。
这让人想到了评论区的那个比喻:"这就像 70 年代的 OS 调度问题,只不过现在的调度单元是推理循环,而不是进程。"
甚至,这还支持"多脑多手"模式。一个大脑可以指挥多个沙箱,甚至大脑之间可以互传"手脚"。
个人觉得,这才是这篇工程博客最野心勃勃的地方。它不只是在解决今天的 Bug,而是在试图定义未来 Agent 的操作系统标准。
当然,评论区也不是全是赞美。有人吐槽"托管服务就是溢价锁定",也有人质疑"为未知设计通常只会产生技术债"。
但有一点是确定的:如果你还在把 Agent 当作一个跑在容器里的单体应用来养,那你可能真的过时了。
把脑子拿出来,让手脚去干活。这才是 Agent 该有的样子。
【锐评】:Anthropic 这波"脑体分离术"不仅治好了 AI 的"容器依赖症",还顺手把运维从"铲屎官"变成了"牧羊人"。未来 Agent 架构的标准范式,可能就藏在这篇博客里。
参考链接:
https://x.com/AnthropicAI/status/2041929199976640948