我写了五万行代码,却一行都没看

缺陷率比手写还低。

这是 Stavros 的原话。不是夸张,是他在运行了一个月 24/7 的 AI 助手 Stavrobot 后的真实体感。

更疯狂的是,他根本没读过那几万行代码的绝大部分。 不是懒得读,是真的不需要。

AI配图

这听起来像程序员在自废武功?恰恰相反。他说自己终于找回了创造的快感——原来我爱的不是编程,是造东西。

编程已死?不,是降级了

Stavros 坦承自己"不在乎编程的乐趣"。这话要是放在五年前,会被 GitHub 上的极客们喷成筛子。

但现在,有了 Codex 5.2、Opus 4.6 这些怪物级模型,逻辑变了。

他展示了一条清晰的退化路径:

  • GPT-2 时代逐行检查代码,像小学老师改作文
  • Davinci 时代检查函数级别,确保每个方块没bug
  • 现在只检查架构,剩下的交给模型自己撕咬

你的工程技能没有贬值,只是从"怎么写"变成了"怎么搭"。

这就像是,你不再需要亲自搬砖,但必须知道这栋楼会不会在地震时倒塌。

三权分立:一个 AI 不够,要三个

最有意思的是他的工作流。不是"问 ChatGPT 然后复制粘贴"那种过家家。

AI配图

他搞了一套多模型制衡系统

建筑师(Claude Opus 4.6)唯一和人类对话的角色。花半小时掰扯需求、边界、 trade-off,直到双方确认"你懂我了"。必须听到"Approved"这个词才会动手。

开发者(Claude Sonnet 4.6)廉价劳动力,严格按照建筑师的蓝图施工,没有决策权。

审查员(Codex 5.4 + Gemini 3 Flash + 偶尔 Opus)关键角色。Codex 被描述为"挑剔且迂腐",正好用来挑刺;Gemini 擅长发现其他模型没看到的盲点。

为什么要用不同模型互相掐架?

因为同一个模型会同意自己的观点。就像你不能让作者自己校对稿子,你需要第二双眼睛,而且这双眼睛最好有点强迫症。

说实话,这招有点狠。让 Google 的模型审 Anthropic 的代码,再让 OpenAI 的模型挑两者的毛病——大厂们互相厮杀,人类坐收渔利。

一小时战役:邮件功能实录

为了证明这不是纸上谈兵,Stavros 贴出了完整的开发日志。

需求很简单:给 Stavrobot 加邮件支持。传统开发怎么也得折腾两天吧?

他用了不到一小时。

但别误会,这不是"AI 唰地一下写完了"的魔法表演。过程充满了人机博弈

AI 先列出五个关键设计问题:邮件怎么进来(IMAP 还是 Webhook)?HTML 怎么处理?要不要线程追踪?

Stavros 拍板:Webhook 接收,SMTP 发送,Markdown 转换,独立处理每封邮件。

然后 AI 开始输出详细计划,列出要改动的 6 个文件。Stavros 突然打断:"等等,记得更新 README 和配置模板。"

AI配图

AI 乖乖补上。

开发到一半,Stavros 又想到新需求:能不能只收邮件不发邮件? 比如我只想转发账单给 AI 分析,但不想让 AI 能回复。

AI 评估后:小改动,把 SMTP 字段设为可选即可。

测试阶段发现 bug:邮件被丢弃了。AI 诊断:种子函数里忘了加 email 身份。修复。

然后 Stavros 发现了更深的问题:为什么每次加新渠道都要改硬编码?不能用列表循环吗?

AI 承认:你说得对,这是技术债。但 Telegram 有特殊逻辑,通用循环可能搞不定。

两人(一人一机)讨论了一会儿边界情况,最后决定部分重构。

最精彩的博弈在结尾。

Stavros 想支持通配符邮箱,比如 *@mydomain.com 匹配所有子域名地址。AI 警告:如果 owner 身份设为通配符,那整个域名的邮件都算是主人发的,会不会有问题?

Stavros 解释:我就用一次性邮箱,比如 company@mydomain.com,必须让 AI 认出来。

AI 立刻 catch 到安全风险:那如果有人用 me@mydomain.com"@evildomain.com 这种伪造地址呢?

Stavros 要求:确保星号不能匹配 @ 符号。

AI 搞定:把星号转成正则 [^@]*,完美封堵。

看到了吗?这不是人类在监督 AI,是两个工程师在结对编程。 只不过其中一个没有肉体,且不会疲惫。

黑暗面:不懂技术就是灾难

但故事到这里有个危险的反转。

Stavros 承认,当你对底层技术不够熟悉时,AI 会迅速制造出一座屎山。

代码不会立刻崩溃,但会堆积"错误的决策"。你告诉 AI "这不对",它说"我知道,让我修",然后越修越烂,直到进入**"无法解开的混乱状态"**。

这时候你盯着屏幕,看着 AI 像无头苍蝇一样乱撞,会有一种深深的无力感。

所以编程技能没有消失,只是转移到了更早的阶段。 如果你不懂架构,AI 就是你的灾难;如果你懂,AI 就是你的杠杆。

这像什么?像是从司机变成了领航员。你不需要踩油门,但你必须知道这条路是不是通向悬崖。

未来是建筑师还是清道夫?

Stavros 的实验揭示了一个尴尬的事实:纯代码写作正在贬值,但系统设计正在升值。

当模型明年进化到连架构都不需要人类检查时,程序员会变成什么?是戴着白手套的策展人,还是拿着灭火器的修理工?

或者说,当每个人都能指挥 AI 写出五万行代码时,能问出正确问题的人,才是真正的稀缺品。

毕竟, garbage in, garbage out 这条铁律,AI 再强也打破不了。

【kimi-k2.5锐评】:当程序员终于承认"我不爱写代码只爱造东西"时,AI 成了最好的心理医生和最高效的代笔,但问题是——如果连架构设计也被模型接管了,人类还能 claiming 这是"我的"项目吗?

参考链接:
https://www.stavros.io/posts/how-i-write-software-with-llms/