OpenAI 扔下三颗“核弹”：你的 AI 打工仔，终于能干实事了

说实话，现在的 AI 智能体，大多只能算是个“话痨”。

你让它写个代码，它能在对话框里写得天花乱坠，真要跑起来？抱歉，它没手。你让它处理几万行的 Excel，它聊着聊着就忘了前文是啥，这就是所谓的“上下文天花板”。

但就在昨天，OpenAI 的开发者账号发了一条推文，看似平平无奇，实则把这几个痛点全给捅了。

他们发布了三个新原语：Skills（技能）、Shell（终端）、Compaction（压缩）。

这不仅仅是 API 的更新，这是在把 AI 从“陪聊机器人”强行拽进“数字打工人”的行列。哪怕是最挑剔的开发者，看完这波更新也得承认：能干活的 AI，真的来了。

不止是聊天，这是给 AI 装上了“手”和“脑”

以前我们用 AI，像是隔着一层玻璃指挥它。

现在，OpenAI 直接把玻璃砸了。

最核心的变化是 Shell 工具。这是个什么鬼东西？简单说，它就是一个 OpenAI 托管的容器，也就是一台真正的虚拟电脑。

这意味着什么？AI 不再只是生成代码文本给你看，它能直接在这个环境里安装依赖、运行脚本、甚至写报告并保存成文件。

想象一下，你让 AI 去分析一个数据集。以前它只能给你一段分析代码，你自己跑。现在？它自己在 Shell 里把 Python 库装好，脚本跑了，最后把生成的图表扔进 /mnt/data 目录，你只需要下载结果。

这就是“执行”层面的降维打击。

但光有手还不够，干活得有章法。这就是 Skills 登场的时候了。

你可以把 Skills 理解成 AI 的“技能包”或者“SOP（标准作业程序）”。以前你教 AI 干活，得把几千字的指令塞进 System Prompt 里，又臭又长，还容易乱。

现在，你可以把这些流程打包成一个 Skill。AI 需要用到的时候，自己加载，用完即走。

这就好比你不用每次都教厨师怎么切洋葱，你只需要告诉他：“今天这道菜，请参照‘法式切丁’的 Skill 来做。”

那个让人头疼的“健忘症”，有药了

做 Agent 开发的人最怕什么？

怕跑着跑着，上下文窗口满了，程序崩了。

这就是所谓的“多小工作流”噩梦。你想让 AI 连续干几个小时的活，它聊了半小时就断片，前功尽弃。

OpenAI 这次祭出的 Server-side compaction（服务端压缩），就是专门治这个病的。

它的逻辑很简单：当对话太长时，系统自动把前面的内容压缩，保留关键信息，扔掉废话，让对话能无限续杯。

有个叫 ejae_dev 的开发者在评论区说得很直白：

“服务端压缩才是真正的解锁点。大多数智能体框架在 30 分钟后就会撞上上下文墙然后直接挂掉。我很好奇压缩是怎么决定保留什么丢弃什么的，特别是在代码繁重的会话中，丢了 2000 token 前的一个变量赋值就全完了。”

这确实是把双刃剑，但至少，OpenAI 给了我们一把能劈开这堵墙的斧头，而不是让我们继续用头去撞。

别光看热闹，这里有坑

老实讲，技术虽好，但玩不好容易炸。

OpenAI 在文档里特意提到了一个高风险操作：Skills + 网络。

如果你给了 AI 强大的技能包，又给它开了不受限的互联网权限，那基本上等于给黑客开了后门。数据外泄？那都是分分钟的事。

官方的建议很直接：把网络权限锁死。

默认姿势应该是：

Skills：允许。
Shell：允许。
网络：没门。除非你设置了极其严格的白名单。

这不仅仅是技术建议，这是保命指南。在这个 AI 还不够完美的时代，哪怕是一点点“越狱”的风险，我们都承担不起。

真实案例：有人把准确率干到了 85%

理论说得再好听，不如看实战。

数据搜索公司 Glean 已经在用这套东西了。他们把 Salesforce 的操作流程做成了一个 Skill。

结果如何？

准确率直接从 73% 飙升到了 85%，而且首字生成时间还缩短了 18.1%。

这数据太漂亮了。他们是怎么做到的？

除了常规的优化，他们用了两个很“反直觉”的招数：

加负面例子：在 Skill 描述里明确告诉 AI“什么时候别用这个技能”。这反而减少了误触。
把模板塞进 Skill：别往 System Prompt 里塞模板了，全放 Skill 里。只有触发的时候才加载，既省 Token 又精准。

这说明什么？说明现在的 AI，需要的不是更聪明的 Prompt，而是更清晰的“边界”和“规矩”。

技术狂奔，用户在骂

有意思的是，就在这篇技术文章下面，画风突变。

开发者们在欢呼“游戏规则改变者”，在讨论容器复用时间，在研究压缩算法。

但另一拨用户，却在评论区刷起了 #keep4o 和 #OpenSource4o。

有人在喊：“把我们的数据还给我们！”有人在骂：“当 CEO 对大规模悲伤耸肩时，那不是愿景，那是傲慢。”

这场景太魔幻了。

一边是 OpenAI 在给 AI 装上 Shell 和 Skills，试图让它成为最完美的“企业打工人”；另一边，却是真实的人类用户在愤怒地抗议，想要拿回属于自己的数据控制权。

技术正在以惊人的速度重塑我们的工作流，但有时候，最难的并不是让 AI 变得更聪明，而是如何让驾驭这些技术的人，感到安心。

这或许才是比“上下文压缩”更难解的终极问题吧。

参考链接：
https://x.com/OpenAIDevs/status/2021725246244671606