大家都疯了似的追逐更强的模型,GPT-5.4、Claude 4.6、Gemini 3……仿佛只要模型智商够高,AI Agent 就能像真人一样工作。
但这可能是个巨大的误区。
LangChain 的联合创始人兼 CEO Harrison Chase 最近在 VentureBeat 的播客里泼了一盆冷水:光有聪明的模型没用,如果外面的“ harness(缰绳/套件)”没跟上,你的 Agent 照样是个傻子。
从“防傻子”到“放权者”
以前我们怎么搞 AI?简单说就是“防”。
传统的 AI harness(套件),主要任务是防止模型瞎跑。别循环,别乱调工具,老老实实回答问题。那时候模型能力确实也不行,Chase 直言,以前的模型“低于有用的阈值”,根本跑不了循环,开发者只能画图表、写链条,手把手教它每一步。
现在不一样了。
Chase 提出了一个很有意思的概念:Harness Engineering(套件工程)。
这不仅仅是提示词工程,而是给模型搭建的一个环境。现在的趋势是反过来的——要把控制权还给 LLM。
“让 LLM 自己决定它想看什么,不想看什么。”
这有点反直觉。我们以前总觉得要控制一切,现在却发现,想让 Agent 独立完成长任务,你得敢放手。让模型自己管理上下文,自己决定什么时候该压缩信息,这才是让 Agent 变得“自主”的关键。
AutoGPT 的尸体还在那埋着
“放手”这两个字说起来容易,做起来全是坑。
Chase 提到了一个让人唏嘘的案例:AutoGPT。
这玩意儿曾经是 GitHub 历史上增长最快的项目,风光无限。它的架构和现在顶尖的 Agent 几乎一模一样,但结果呢?凉得很快。
为什么?因为当时的模型还不够好,无法可靠地在循环中运行。架构对了,时机错了,就是一场空。
但现在,时机可能真的到了。Chase 认为模型已经跨过了那个“有用性阈值”,我们可以开始构建真正能跑长任务的 Agent 了。LangChain 的答案就是 Deep Agents。
让 Agent 有脑子,得先给它个“记事本”
Deep Agents 到底想解决什么问题?
想象一下,让你去做一件 200 步的任务,不让你记笔记,你肯定干到第 10 步就忘了前面要干嘛。
Agent 也一样。
Chase 强调,连贯性(Coherence)是长任务的核心。Deep Agents 的设计很有意思,它给 Agent 配备了虚拟文件系统。简单说,就是给了 Agent 一个“记事本”和“待办事项列表”。
“当它进行到第 200 步的时候,它得有一种追踪进度、保持连贯性的方法。”
这不仅仅是存文件,这是让 LLM 把它的思考过程写下来。
更有意思的是它的“分包”逻辑。Deep Agents 可以把任务分发给子 Agent,这些子 Agent 有独立的上下文环境。
这点太重要了。
你想想,如果你让一个 Agent 干所有事,它的上下文窗口早就乱成一锅粥了。子 Agent 干完活,只返回一个压缩后的结果给主 Agent,既干净又省 Token。这才是真正的高级打工仔——各司其职,互不干扰。
上下文工程:一场关于“看见”的游戏
Chase 在访谈里反复提到了一个词:Context Engineering(上下文工程)。
这词听着挺高大上,Chase 自己都调侃这是“一种非常花哨的说法”。
说白了就是:LLM 到底看到了什么?
开发者看到的代码、日志、系统提示,和 LLM 看到的不一样。当 Agent 报错时,很多时候不是模型傻,是它根本没拿到该拿的信息。
“Agent 搞砸是因为没有正确的上下文;成功是因为有正确的上下文。”
这就像你让一个员工去干活,却把关键文件藏在了抽屉里,然后怪他没干好。
Chase 认为未来的方向是动态加载。别把所有工具都塞进系统提示词里,那样太臃肿。应该像搭积木一样,需要干 X 的时候,再去读取 X 的技能包。
“这是核心基础,如果我需要做 X,让我去读 X 的技能。”
这才是真正的“按需分配”。
OpenAI 买 OpenClaw:一场关于“放手”的博弈
聊到行业大事,Chase 对 OpenAI 收购 OpenClaw 的评价很犀利。
他认为 OpenClaw 之所以能火,是因为它敢“放手去干”。
那种病毒式的传播,是因为没有任何大实验室敢像他们那样激进地让模型去跑。大厂都在求稳,都在加限制,而 OpenClaw 反其道而行之。
但收购之后呢?Chase 表示怀疑。
OpenAI 能不能在保持这种“疯狂”的同时,搞出一个安全的企业级产品?这很难说。毕竟,野马套上缰绳,可能就跑不快了;不套缰绳,又可能把车掀翻。
这就是目前 AI Agent 领域最大的矛盾:我们既想要它的自主性,又害怕它的不可控。
模型会越来越聪明,这几乎是确定的。但正如 Chase 所说,模型越强,它外面的“缰绳”就得越精妙。
【glm-5锐评】:
模型决定上限,工程决定下限,而现在的 Agent 开发者们,大多还在用法拉利的引擎拉砖。
参考链接:
https://venturebeat.com/orchestration/langchains-ceo-argues-that-better-models-alone-wont-get-your-ai-agent-to