实战指南：我是如何用 LLM 写软件的

我写了五万行代码，却一行都没看

缺陷率比手写还低。

这是 Stavros 的原话。不是夸张，是他在运行了一个月 24/7 的 AI 助手 Stavrobot 后的真实体感。

更疯狂的是，他根本没读过那几万行代码的绝大部分。 不是懒得读，是真的不需要。

AI配图

这听起来像程序员在自废武功？恰恰相反。他说自己终于找回了创造的快感——原来我爱的不是编程，是造东西。

编程已死？不，是降级了

Stavros 坦承自己"不在乎编程的乐趣"。这话要是放在五年前，会被 GitHub 上的极客们喷成筛子。

但现在，有了 Codex 5.2、Opus 4.6 这些怪物级模型，逻辑变了。

他展示了一条清晰的退化路径：

GPT-2 时代：逐行检查代码，像小学老师改作文
Davinci 时代：检查函数级别，确保每个方块没bug
现在：只检查架构，剩下的交给模型自己撕咬

你的工程技能没有贬值，只是从"怎么写"变成了"怎么搭"。

这就像是，你不再需要亲自搬砖，但必须知道这栋楼会不会在地震时倒塌。

三权分立：一个 AI 不够，要三个

最有意思的是他的工作流。不是"问 ChatGPT 然后复制粘贴"那种过家家。

AI配图

他搞了一套多模型制衡系统：

建筑师（Claude Opus 4.6）：唯一和人类对话的角色。花半小时掰扯需求、边界、 trade-off，直到双方确认"你懂我了"。必须听到"Approved"这个词才会动手。

开发者（Claude Sonnet 4.6）：廉价劳动力，严格按照建筑师的蓝图施工，没有决策权。

审查员（Codex 5.4 + Gemini 3 Flash + 偶尔 Opus）：关键角色。Codex 被描述为"挑剔且迂腐"，正好用来挑刺；Gemini 擅长发现其他模型没看到的盲点。

为什么要用不同模型互相掐架？

因为同一个模型会同意自己的观点。就像你不能让作者自己校对稿子，你需要第二双眼睛，而且这双眼睛最好有点强迫症。

说实话，这招有点狠。让 Google 的模型审 Anthropic 的代码，再让 OpenAI 的模型挑两者的毛病——大厂们互相厮杀，人类坐收渔利。

一小时战役：邮件功能实录

为了证明这不是纸上谈兵，Stavros 贴出了完整的开发日志。

需求很简单：给 Stavrobot 加邮件支持。传统开发怎么也得折腾两天吧？

他用了不到一小时。

但别误会，这不是"AI 唰地一下写完了"的魔法表演。过程充满了人机博弈：

AI 先列出五个关键设计问题：邮件怎么进来（IMAP 还是 Webhook）？HTML 怎么处理？要不要线程追踪？

Stavros 拍板：Webhook 接收，SMTP 发送，Markdown 转换，独立处理每封邮件。

然后 AI 开始输出详细计划，列出要改动的 6 个文件。Stavros 突然打断："等等，记得更新 README 和配置模板。"

AI配图

AI 乖乖补上。

开发到一半，Stavros 又想到新需求：能不能只收邮件不发邮件？ 比如我只想转发账单给 AI 分析，但不想让 AI 能回复。

AI 评估后：小改动，把 SMTP 字段设为可选即可。

测试阶段发现 bug：邮件被丢弃了。AI 诊断：种子函数里忘了加 email 身份。修复。

然后 Stavros 发现了更深的问题：为什么每次加新渠道都要改硬编码？不能用列表循环吗？

AI 承认：你说得对，这是技术债。但 Telegram 有特殊逻辑，通用循环可能搞不定。

两人（一人一机）讨论了一会儿边界情况，最后决定部分重构。

最精彩的博弈在结尾。

Stavros 想支持通配符邮箱，比如 *@mydomain.com 匹配所有子域名地址。AI 警告：如果 owner 身份设为通配符，那整个域名的邮件都算是主人发的，会不会有问题？

Stavros 解释：我就用一次性邮箱，比如 company@mydomain.com，必须让 AI 认出来。

AI 立刻 catch 到安全风险：那如果有人用 me@mydomain.com"@evildomain.com 这种伪造地址呢？

Stavros 要求：确保星号不能匹配 @ 符号。

AI 搞定：把星号转成正则 [^@]*，完美封堵。

看到了吗？这不是人类在监督 AI，是两个工程师在结对编程。 只不过其中一个没有肉体，且不会疲惫。

黑暗面：不懂技术就是灾难

但故事到这里有个危险的反转。

Stavros 承认，当你对底层技术不够熟悉时，AI 会迅速制造出一座屎山。

代码不会立刻崩溃，但会堆积"错误的决策"。你告诉 AI "这不对"，它说"我知道，让我修"，然后越修越烂，直到进入**"无法解开的混乱状态"**。

这时候你盯着屏幕，看着 AI 像无头苍蝇一样乱撞，会有一种深深的无力感。

所以编程技能没有消失，只是转移到了更早的阶段。 如果你不懂架构，AI 就是你的灾难；如果你懂，AI 就是你的杠杆。

这像什么？像是从司机变成了领航员。你不需要踩油门，但你必须知道这条路是不是通向悬崖。

未来是建筑师还是清道夫？

Stavros 的实验揭示了一个尴尬的事实：纯代码写作正在贬值，但系统设计正在升值。

当模型明年进化到连架构都不需要人类检查时，程序员会变成什么？是戴着白手套的策展人，还是拿着灭火器的修理工？

或者说，当每个人都能指挥 AI 写出五万行代码时，能问出正确问题的人，才是真正的稀缺品。

毕竟， garbage in, garbage out 这条铁律，AI 再强也打破不了。

【kimi-k2.5锐评】：当程序员终于承认"我不爱写代码只爱造东西"时，AI 成了最好的心理医生和最高效的代笔，但问题是——如果连架构设计也被模型接管了，人类还能 claiming 这是"我的"项目吗？

参考链接：
https://www.stavros.io/posts/how-i-write-software-with-llms/