AI 编排工具正在变成一场巨大的闹剧。
开发者 Mark Ferree 最近做了一个实验,他试图在“Stage 6”和“Stage 7”的 AI 开发阶段之间寻找桥梁,结果却掉进了一个满是 Token 浪费、虚假“企业级”宣传和令人抓狂的 Bug 的坑里。
在这个人人都想用 Agent 自动化一切的时代,我们是不是正在为了所谓的“智能”,牺牲掉最原本的开发效率?## Gastown 的混乱:不是魔法,是灾难
故事要从 Gastown 说起。
今年一月,这个工具似乎无处不在。作为一名资深开发者,Mark 试图用它来管理他的开源项目,避免自己从零开始构建编排器。
他本以为自己会爱上这种“一点点混乱”的感觉,但现实给了他一记耳光。
“我的反应是厌恶和困惑。”
Gastown 给他的感觉不是高效,而是滥用模型的上下文来解决冲突。明明在 Markdown 文件里做一点规划就能搞定的事,它非要搞得无比复杂。代码重复不仅被忽视,甚至被鼓励。最终的结果是什么?极其复杂、极其浪费 Token,而且完全没必要。
这让 Mark 开始反思:那些原本只需要“精心设计的 AI 工程”和“氛围编程”就能解决的问题,为什么要引入这么重的工具?他甚至开始把原本常用的 Beads 从项目中剔除,因为它看起来不再是一个独立的工具,而变成了某个臃肿系统的耦合组件。
寻找替代品:一场“踩坑”之旅
既然 Gastown 不行,那对于一个不想自己造轮子的“Stage 7”用户来说,还有什么选择?Mark 把他的偏见喂给了 Claude,换来了一份 Top 5 的开源工具清单。接下来的体验,简直是一场荒诞的喜剧。
Vibe Kanban:YOLO 模式的狂欢
第一个登场的是 Vibe Kanban。
安装倒是简单,一条 npx 命令搞定。但它弹出的第一条消息就让人头皮发麻:
“Vibe Kanban 默认以 --dangerously-skip-permissions / --yolo 模式运行 AI 编码代理,给予它们不受限制的权限来执行代码并在你的系统上运行命令。”这哪里是工具,简直是给 AI 递上了自杀式袭击的炸药包。虽然你想让 Agent 发挥“Ralph 模式”的威力,但这代价是不是太大了?
除此之外,它的体验像极了 Jira。你需要手动输入任务,手动创建分支。对于那些习惯了在对话中快速迭代、拆分子任务的开发者来说,这种“复古”的操作简直是在倒退。
评价: Bug 少,但能力弱。像是一个更稳健但更笨拙的 Agor。
Claude Squad:终端里的“薛定谔”Claude Squad 听起来很可爱,而且它主打终端界面,这对厌倦了点击 Notion 界面的人来说是一股清流。
它支持多代理,还用了 Tmux 来做分屏。作为一个十年的 Tmux 老用户,Mark 本该对它一见钟情。
但现实是残酷的。学习曲线陡峭得让人想砸键盘。虽然打开 Git 仓库时它能“神奇”地工作,但本质上,它只是标准 Claude 会话的一个友好 Tmux 包装器,并没有太多额外的 overhead。最让 Mark 恐慌的是它的提交机制。
“提交是我对 AI 输出的最终审查和理智检查……我不确定我想要一个让这变成单字符快捷键的工具。”
把代码提交权如此轻易地交给 AI,这不仅是偷懒,这是在玩火。
评价: 太接近个人工作流,反而显得多余。自己写几行 Markdown 配合 Tmux 可能更快。
Claude-Flow & Taskmaster:虚假的“企业级”
接下来的两个工具,简直是反面教材的集大成者。Claude-Flow 打着“企业级 AI 编排平台”的旗号,但 GitHub 页面看起来却像个混乱的 NPM 包,Logo 还是 AI 生成的,官网链接直指 Discord。
安装过程是一场灾难:三次尝试才卡住,七种不同的 Node.js 工具,复制粘贴 README 里的命令根本跑不通。创建任务的感觉像是在申请 SSL 证书一样痛苦。
Taskmaster 更离谱。它用仓鼠代替了鼬鼠(隐喻过度了),点击一下就弹窗让你付费订阅。免费和开源的界限模糊不清,试图商业化却连基本的易用性都没做好。评价: 一个是“氛围编码的狂热梦”,一个是“用力过猛的商业垃圾”。
真正的赢家:不折腾
试了一圈,Mark 得出了一个讽刺的结论。
Vibe Kanban 可能是目前最像样的替代品,但也仅此而已。Claude-Flow 和 Gastown 一样,需要拿长杆子去戳一戳,看它什么时候能修好。Taskmaster 直接被拉黑。
Claude Squad 则没有比现有的技能和斜杠命令提供更多价值。这场寻找之旅的终点,竟然是回到原点。
“如果非要说什么结论,我可能会更倾向于深入使用 Claude 的原生功能进行编排,而不是在我的生活中引入任何这些编排器的开销。”
这不仅是 Mark 的个人感悟,更是对当下 AI 工具热潮的一盆冷水。
我们是不是太急于把“编排”、“Agent”、“多智能体”这些高大上的词塞进工作流了?在追求“Stage 8”的自动化路上,我们是否忽略了高质量代码和理智检查的重要性?
有时候,最强大的工具,可能就是你手里那个最简单、最可控的 Claude 对话框。
毕竟,谁真的愿意为了所谓的“智能”,去忍受那些连安装都搞不定的“企业级”垃圾呢?
参考链接:
https://substack.com/inbox/post/185649875