说实话,现在的 AI 智能体,大多只能算是个“话痨”。

你让它写个代码,它能在对话框里写得天花乱坠,真要跑起来?抱歉,它没手。你让它处理几万行的 Excel,它聊着聊着就忘了前文是啥,这就是所谓的“上下文天花板”。

image

但就在昨天,OpenAI 的开发者账号发了一条推文,看似平平无奇,实则把这几个痛点全给捅了。

image

他们发布了三个新原语:Skills(技能)、Shell(终端)、Compaction(压缩)。

这不仅仅是 API 的更新,这是在把 AI 从“陪聊机器人”强行拽进“数字打工人”的行列。哪怕是最挑剔的开发者,看完这波更新也得承认:能干活的 AI,真的来了。

image

不止是聊天,这是给 AI 装上了“手”和“脑”

以前我们用 AI,像是隔着一层玻璃指挥它。

现在,OpenAI 直接把玻璃砸了。

最核心的变化是 Shell 工具。这是个什么鬼东西?简单说,它就是一个 OpenAI 托管的容器,也就是一台真正的虚拟电脑。

这意味着什么?AI 不再只是生成代码文本给你看,它能直接在这个环境里安装依赖、运行脚本、甚至写报告并保存成文件。

想象一下,你让 AI 去分析一个数据集。以前它只能给你一段分析代码,你自己跑。现在?它自己在 Shell 里把 Python 库装好,脚本跑了,最后把生成的图表扔进 /mnt/data 目录,你只需要下载结果。

这就是“执行”层面的降维打击。

但光有手还不够,干活得有章法。这就是 Skills 登场的时候了。

你可以把 Skills 理解成 AI 的“技能包”或者“SOP(标准作业程序)”。以前你教 AI 干活,得把几千字的指令塞进 System Prompt 里,又臭又长,还容易乱。

现在,你可以把这些流程打包成一个 Skill。AI 需要用到的时候,自己加载,用完即走。

这就好比你不用每次都教厨师怎么切洋葱,你只需要告诉他:“今天这道菜,请参照‘法式切丁’的 Skill 来做。”

那个让人头疼的“健忘症”,有药了

做 Agent 开发的人最怕什么?

怕跑着跑着,上下文窗口满了,程序崩了。

这就是所谓的“多小工作流”噩梦。你想让 AI 连续干几个小时的活,它聊了半小时就断片,前功尽弃。

OpenAI 这次祭出的 Server-side compaction(服务端压缩),就是专门治这个病的。

它的逻辑很简单:当对话太长时,系统自动把前面的内容压缩,保留关键信息,扔掉废话,让对话能无限续杯。

有个叫 ejae_dev 的开发者在评论区说得很直白:

“服务端压缩才是真正的解锁点。大多数智能体框架在 30 分钟后就会撞上上下文墙然后直接挂掉。我很好奇压缩是怎么决定保留什么丢弃什么的,特别是在代码繁重的会话中,丢了 2000 token 前的一个变量赋值就全完了。”

这确实是把双刃剑,但至少,OpenAI 给了我们一把能劈开这堵墙的斧头,而不是让我们继续用头去撞。

别光看热闹,这里有坑

老实讲,技术虽好,但玩不好容易炸。

OpenAI 在文档里特意提到了一个高风险操作:Skills + 网络

如果你给了 AI 强大的技能包,又给它开了不受限的互联网权限,那基本上等于给黑客开了后门。数据外泄?那都是分分钟的事。

官方的建议很直接:把网络权限锁死。

默认姿势应该是:

  • Skills:允许。
  • Shell:允许。
  • 网络:没门。除非你设置了极其严格的白名单。

这不仅仅是技术建议,这是保命指南。在这个 AI 还不够完美的时代,哪怕是一点点“越狱”的风险,我们都承担不起。

真实案例:有人把准确率干到了 85%

理论说得再好听,不如看实战。

数据搜索公司 Glean 已经在用这套东西了。他们把 Salesforce 的操作流程做成了一个 Skill。

结果如何?

准确率直接从 73% 飙升到了 85%,而且首字生成时间还缩短了 18.1%

这数据太漂亮了。他们是怎么做到的?

除了常规的优化,他们用了两个很“反直觉”的招数:

  1. 加负面例子在 Skill 描述里明确告诉 AI“什么时候用这个技能”。这反而减少了误触。
  2. 把模板塞进 Skill别往 System Prompt 里塞模板了,全放 Skill 里。只有触发的时候才加载,既省 Token 又精准。

这说明什么?说明现在的 AI,需要的不是更聪明的 Prompt,而是更清晰的“边界”和“规矩”。

技术狂奔,用户在骂

有意思的是,就在这篇技术文章下面,画风突变。

开发者们在欢呼“游戏规则改变者”,在讨论容器复用时间,在研究压缩算法。

但另一拨用户,却在评论区刷起了 #keep4o#OpenSource4o

有人在喊:“把我们的数据还给我们!”有人在骂:“当 CEO 对大规模悲伤耸肩时,那不是愿景,那是傲慢。”

这场景太魔幻了。

一边是 OpenAI 在给 AI 装上 Shell 和 Skills,试图让它成为最完美的“企业打工人”;另一边,却是真实的人类用户在愤怒地抗议,想要拿回属于自己的数据控制权。

技术正在以惊人的速度重塑我们的工作流,但有时候,最难的并不是让 AI 变得更聪明,而是如何让驾驭这些技术的人,感到安心。

这或许才是比“上下文压缩”更难解的终极问题吧。

参考链接:
https://x.com/OpenAIDevs/status/2021725246244671606