有个AI连续工作了120小时,老板没给加班费,它也没崩溃。

这不是科幻。月之暗面(Moonshot AI)刚扔出一颗炸弹:Kimi K2.6,一个能连续跑5天的智能体模型。不是聊天聊5天,是实打实地监控系统、修bug、做 incident response,中间没人喂提示词,也没人喊卡。

AI配图

而此刻,全世界大多数AI编排框架,还在为"秒级"和"分钟级"的任务沾沾自喜。

当"长时运行"成为新常态,旧架构开始崩裂

说实话,我们之前的AI应用,本质上都是"快男"。问个问题,答完就走;写段代码,提交即结束。Anthropic的Claude Code、OpenAI的Codex,虽然支持多会话和后台执行,但骨子里还是假设:这活儿, Bounded-time,有边界的。

但现在不一样了。

企业开始要求AI像真正的初级工程师一样,持续地、有状态地活着。它得记得三天前改了一半的代码,得盯着昨晚出现的内存泄漏,得在周末自动回滚那个有问题的部署。

问题是,大多数编排框架(Orchestration Frameworks)根本没见过这场面。

它们是为"短平快"设计的。当智能体开始调用上千次API、修改数千行代码、在变化的环境中连续运行数小时,这些框架就像用自行车链条拉卡车——嘎吱作响,随时可能崩断。

月之暗面的解法:让300个"数字员工"自己管自己

Kimi K2.6的打法很野。

AI配图

它不玩"主从架构"那一套。Claude Code和Codex那种"一个主智能体指挥若干小弟"的模式,在月之暗面看来,还是太像预制菜——角色是预定义的,流程是写死的。

Kimi K2.6直接甩出Agent Swarms(智能体蜂群)最多300个子智能体,同时执行4000个协调步骤。 而且,谁来指挥谁,不是人类写死的,是模型自己动态决定的。

这意味着什么?意味着你扔给它一个任务,比如"把这个8年前的老金融引擎重构一下",它能自己拆解、自己分配、自己协调,中间还能根据环境变化调整计划。

"相比预定义角色,K2.6依赖模型自身来决定编排。"

听起来很美好。但从业者Maxim Saplin泼了盆冷水:"编排仍然脆弱。这不是写个更严厉的提示词能解决的,这是产品和训练问题。"

那些跑出来的"恐怖故事"

月之暗面给VentureBeat看了些内部数据,相当夸张。

10小时K2.6从零写了一个完整的SysY编译器,通过了全部140个功能测试。月之暗面说,这相当于4个工程师干2个月的活儿。

13小时重构那个8年历史的开源金融匹配引擎。过程中迭代了12种优化策略,发起超过1000次工具调用,精准修改4000多行代码

5天一个部署在生产环境的监控智能体,自主运行了整整五天,处理监控、事件响应和系统运维,没人盯着

这些数字背后藏着一个真相:模型能力已经跑在了编排创新的前头。 就像给F1赛车配了个自行车刹车,能跑,但你敢不敢全油门?

暗面:治理缺口与无法回滚的恐惧

跑得快不一定跑得稳。

ArmorCode的CPO Mark Lambert直言:"治理缺口已经超过了部署速度。" 这些智能体现在生成代码和系统变更的速度,比大多数组织审查、修复或治理它们的速度还快。

AI配图

想象一下:一个AI连续跑了五天,改了上千处代码,中间做了无数决策。如果最后一天发现它引入了安全漏洞,你怎么回滚? 它的"记忆"是分布式的,它的操作是连续的,传统的版本控制和审计日志在这种**状态化(stateful)**的执行面前,显得苍白无力。

更麻烦的是身份问题。F5的CPO Kunal Anand说,我们正经历一场架构范式的迁移从脚本到服务,到容器,到函数,现在到作为持久基础设施的智能体

"这需要新的类别命名:Agent Runtime(智能体运行时)、Agent Gateway(智能体网关)、Agent Identity Provider(智能体身份提供商)、Agent Mesh(智能体网格)。API网关模式正在变异,它得理解目标和工作流,而不只是端点和动词。"**

换句话说,我们连给这些"长命AI"起名字的基础设施都还没准备好,更别说管它们了。

结语:当AI开始"上班",人类还没准备好考勤

Kimi K2.6开源在Hugging Face上,任何人都能试试让AI连续跑几天不睡觉。

但问题是,你的CI/CD pipeline准备好了吗?你的安全审计能跟上吗?你的回滚策略能处理一个"活"了120小时的智能体吗?

我们正站在一个奇怪的拐点上:AI不再只是工具,它正在变成同事——那种不需要咖啡、不会请假、但可能会在你睡觉时把数据库删了的同事。

它已经开始连续工作五天了。你,敢让它跑多久?

【锐评】:当AI从"秒回工具"进化成"五天不眠的数字员工",崩溃的不是显卡,是上世纪的管理学和DevOps流程。

参考链接:
https://venturebeat.com/orchestration/kimi-k2-6-runs-agents-for-days-and-exposes-the-limits-of-enterprise-orchestration