我写了五万行代码,却一行都没看
缺陷率比手写还低。
这是 Stavros 的原话。不是夸张,是他在运行了一个月 24/7 的 AI 助手 Stavrobot 后的真实体感。
更疯狂的是,他根本没读过那几万行代码的绝大部分。 不是懒得读,是真的不需要。
这听起来像程序员在自废武功?恰恰相反。他说自己终于找回了创造的快感——原来我爱的不是编程,是造东西。
编程已死?不,是降级了
Stavros 坦承自己"不在乎编程的乐趣"。这话要是放在五年前,会被 GitHub 上的极客们喷成筛子。
但现在,有了 Codex 5.2、Opus 4.6 这些怪物级模型,逻辑变了。
他展示了一条清晰的退化路径:
- GPT-2 时代:逐行检查代码,像小学老师改作文
- Davinci 时代:检查函数级别,确保每个方块没bug
- 现在:只检查架构,剩下的交给模型自己撕咬
你的工程技能没有贬值,只是从"怎么写"变成了"怎么搭"。
这就像是,你不再需要亲自搬砖,但必须知道这栋楼会不会在地震时倒塌。
三权分立:一个 AI 不够,要三个
最有意思的是他的工作流。不是"问 ChatGPT 然后复制粘贴"那种过家家。
他搞了一套多模型制衡系统:
建筑师(Claude Opus 4.6):唯一和人类对话的角色。花半小时掰扯需求、边界、 trade-off,直到双方确认"你懂我了"。必须听到"Approved"这个词才会动手。
开发者(Claude Sonnet 4.6):廉价劳动力,严格按照建筑师的蓝图施工,没有决策权。
审查员(Codex 5.4 + Gemini 3 Flash + 偶尔 Opus):关键角色。Codex 被描述为"挑剔且迂腐",正好用来挑刺;Gemini 擅长发现其他模型没看到的盲点。
为什么要用不同模型互相掐架?
因为同一个模型会同意自己的观点。就像你不能让作者自己校对稿子,你需要第二双眼睛,而且这双眼睛最好有点强迫症。
说实话,这招有点狠。让 Google 的模型审 Anthropic 的代码,再让 OpenAI 的模型挑两者的毛病——大厂们互相厮杀,人类坐收渔利。
一小时战役:邮件功能实录
为了证明这不是纸上谈兵,Stavros 贴出了完整的开发日志。
需求很简单:给 Stavrobot 加邮件支持。传统开发怎么也得折腾两天吧?
他用了不到一小时。
但别误会,这不是"AI 唰地一下写完了"的魔法表演。过程充满了人机博弈:
AI 先列出五个关键设计问题:邮件怎么进来(IMAP 还是 Webhook)?HTML 怎么处理?要不要线程追踪?
Stavros 拍板:Webhook 接收,SMTP 发送,Markdown 转换,独立处理每封邮件。
然后 AI 开始输出详细计划,列出要改动的 6 个文件。Stavros 突然打断:"等等,记得更新 README 和配置模板。"
AI 乖乖补上。
开发到一半,Stavros 又想到新需求:能不能只收邮件不发邮件? 比如我只想转发账单给 AI 分析,但不想让 AI 能回复。
AI 评估后:小改动,把 SMTP 字段设为可选即可。
测试阶段发现 bug:邮件被丢弃了。AI 诊断:种子函数里忘了加 email 身份。修复。
然后 Stavros 发现了更深的问题:为什么每次加新渠道都要改硬编码?不能用列表循环吗?
AI 承认:你说得对,这是技术债。但 Telegram 有特殊逻辑,通用循环可能搞不定。
两人(一人一机)讨论了一会儿边界情况,最后决定部分重构。
最精彩的博弈在结尾。
Stavros 想支持通配符邮箱,比如 *@mydomain.com 匹配所有子域名地址。AI 警告:如果 owner 身份设为通配符,那整个域名的邮件都算是主人发的,会不会有问题?
Stavros 解释:我就用一次性邮箱,比如 company@mydomain.com,必须让 AI 认出来。
AI 立刻 catch 到安全风险:那如果有人用 me@mydomain.com"@evildomain.com 这种伪造地址呢?
Stavros 要求:确保星号不能匹配 @ 符号。
AI 搞定:把星号转成正则 [^@]*,完美封堵。
看到了吗?这不是人类在监督 AI,是两个工程师在结对编程。 只不过其中一个没有肉体,且不会疲惫。
黑暗面:不懂技术就是灾难
但故事到这里有个危险的反转。
Stavros 承认,当你对底层技术不够熟悉时,AI 会迅速制造出一座屎山。
代码不会立刻崩溃,但会堆积"错误的决策"。你告诉 AI "这不对",它说"我知道,让我修",然后越修越烂,直到进入**"无法解开的混乱状态"**。
这时候你盯着屏幕,看着 AI 像无头苍蝇一样乱撞,会有一种深深的无力感。
所以编程技能没有消失,只是转移到了更早的阶段。 如果你不懂架构,AI 就是你的灾难;如果你懂,AI 就是你的杠杆。
这像什么?像是从司机变成了领航员。你不需要踩油门,但你必须知道这条路是不是通向悬崖。
未来是建筑师还是清道夫?
Stavros 的实验揭示了一个尴尬的事实:纯代码写作正在贬值,但系统设计正在升值。
当模型明年进化到连架构都不需要人类检查时,程序员会变成什么?是戴着白手套的策展人,还是拿着灭火器的修理工?
或者说,当每个人都能指挥 AI 写出五万行代码时,能问出正确问题的人,才是真正的稀缺品。
毕竟, garbage in, garbage out 这条铁律,AI 再强也打破不了。
【kimi-k2.5锐评】:当程序员终于承认"我不爱写代码只爱造东西"时,AI 成了最好的心理医生和最高效的代笔,但问题是——如果连架构设计也被模型接管了,人类还能 claiming 这是"我的"项目吗?
参考链接:
https://www.stavros.io/posts/how-i-write-software-with-llms/