试了一圈最火的AI Agent编排工具，我只想说：别折腾了

AI 编排工具正在变成一场巨大的闹剧。

开发者 Mark Ferree 最近做了一个实验，他试图在“Stage 6”和“Stage 7”的 AI 开发阶段之间寻找桥梁，结果却掉进了一个满是 Token 浪费、虚假“企业级”宣传和令人抓狂的 Bug 的坑里。

在这个人人都想用 Agent 自动化一切的时代，我们是不是正在为了所谓的“智能”，牺牲掉最原本的开发效率？## Gastown 的混乱：不是魔法，是灾难

故事要从 Gastown 说起。

今年一月，这个工具似乎无处不在。作为一名资深开发者，Mark 试图用它来管理他的开源项目，避免自己从零开始构建编排器。

他本以为自己会爱上这种“一点点混乱”的感觉，但现实给了他一记耳光。

“我的反应是厌恶和困惑。”

Gastown 给他的感觉不是高效，而是滥用模型的上下文来解决冲突。明明在 Markdown 文件里做一点规划就能搞定的事，它非要搞得无比复杂。代码重复不仅被忽视，甚至被鼓励。最终的结果是什么？极其复杂、极其浪费 Token，而且完全没必要。

这让 Mark 开始反思：那些原本只需要“精心设计的 AI 工程”和“氛围编程”就能解决的问题，为什么要引入这么重的工具？他甚至开始把原本常用的 Beads 从项目中剔除，因为它看起来不再是一个独立的工具，而变成了某个臃肿系统的耦合组件。

寻找替代品：一场“踩坑”之旅

既然 Gastown 不行，那对于一个不想自己造轮子的“Stage 7”用户来说，还有什么选择？Mark 把他的偏见喂给了 Claude，换来了一份 Top 5 的开源工具清单。接下来的体验，简直是一场荒诞的喜剧。

Vibe Kanban：YOLO 模式的狂欢

第一个登场的是 Vibe Kanban。

安装倒是简单，一条 npx 命令搞定。但它弹出的第一条消息就让人头皮发麻：

“Vibe Kanban 默认以 --dangerously-skip-permissions / --yolo 模式运行 AI 编码代理，给予它们不受限制的权限来执行代码并在你的系统上运行命令。”这哪里是工具，简直是给 AI 递上了自杀式袭击的炸药包。虽然你想让 Agent 发挥“Ralph 模式”的威力，但这代价是不是太大了？

除此之外，它的体验像极了 Jira。你需要手动输入任务，手动创建分支。对于那些习惯了在对话中快速迭代、拆分子任务的开发者来说，这种“复古”的操作简直是在倒退。

评价： Bug 少，但能力弱。像是一个更稳健但更笨拙的 Agor。

Claude Squad：终端里的“薛定谔”Claude Squad 听起来很可爱，而且它主打终端界面，这对厌倦了点击 Notion 界面的人来说是一股清流。

它支持多代理，还用了 Tmux 来做分屏。作为一个十年的 Tmux 老用户，Mark 本该对它一见钟情。

但现实是残酷的。学习曲线陡峭得让人想砸键盘。虽然打开 Git 仓库时它能“神奇”地工作，但本质上，它只是标准 Claude 会话的一个友好 Tmux 包装器，并没有太多额外的 overhead。最让 Mark 恐慌的是它的提交机制。

“提交是我对 AI 输出的最终审查和理智检查……我不确定我想要一个让这变成单字符快捷键的工具。”

把代码提交权如此轻易地交给 AI，这不仅是偷懒，这是在玩火。

评价： 太接近个人工作流，反而显得多余。自己写几行 Markdown 配合 Tmux 可能更快。

Claude-Flow & Taskmaster：虚假的“企业级”

接下来的两个工具，简直是反面教材的集大成者。Claude-Flow 打着“企业级 AI 编排平台”的旗号，但 GitHub 页面看起来却像个混乱的 NPM 包，Logo 还是 AI 生成的，官网链接直指 Discord。

安装过程是一场灾难：三次尝试才卡住，七种不同的 Node.js 工具，复制粘贴 README 里的命令根本跑不通。创建任务的感觉像是在申请 SSL 证书一样痛苦。

Taskmaster 更离谱。它用仓鼠代替了鼬鼠（隐喻过度了），点击一下就弹窗让你付费订阅。免费和开源的界限模糊不清，试图商业化却连基本的易用性都没做好。评价： 一个是“氛围编码的狂热梦”，一个是“用力过猛的商业垃圾”。

真正的赢家：不折腾

试了一圈，Mark 得出了一个讽刺的结论。

Vibe Kanban 可能是目前最像样的替代品，但也仅此而已。Claude-Flow 和 Gastown 一样，需要拿长杆子去戳一戳，看它什么时候能修好。Taskmaster 直接被拉黑。

Claude Squad 则没有比现有的技能和斜杠命令提供更多价值。这场寻找之旅的终点，竟然是回到原点。

“如果非要说什么结论，我可能会更倾向于深入使用 Claude 的原生功能进行编排，而不是在我的生活中引入任何这些编排器的开销。”

这不仅是 Mark 的个人感悟，更是对当下 AI 工具热潮的一盆冷水。

我们是不是太急于把“编排”、“Agent”、“多智能体”这些高大上的词塞进工作流了？在追求“Stage 8”的自动化路上，我们是否忽略了高质量代码和理智检查的重要性？

有时候，最强大的工具，可能就是你手里那个最简单、最可控的 Claude 对话框。

毕竟，谁真的愿意为了所谓的“智能”，去忍受那些连安装都搞不定的“企业级”垃圾呢？

参考链接：
https://substack.com/inbox/post/185649875