400美元。
这是复现当前顶级开源代码模型性能所需的全部算力成本。
在动辄烧钱数百万的大模型军备竞赛里,这个数字简直像个玩笑。更讽刺的是,搞出这个名为 SERA 的新模型的,不是什么巨头军团,而是主要由 Ai2 的一个研究员 单枪匹马完成的。
这就是今天科技圈最炸裂的故事:当大厂还在用封闭的、昂贵的代码Agent筑起高墙,Ai2 直接把墙拆了,还顺手把门票价格打到了地板上。
封闭黑盒的“阿喀琉斯之踵”
过去一年,代码Agent确实变强了。
它们能Debug、重构代码,甚至直接提交Pull Request。但这行有个公开的秘密:这些系统大多既封闭又昂贵,还极其“傲慢”。
为什么说傲慢?
因为那些闭源的SOTA模型,根本没见过你公司内部的代码库。你的私有API、特殊的代码规范、那些只有老员工才懂的“屎山”逻辑,对它们来说就是天书。
想让它们懂?你得搞微调。
可微调代码Agent太痛苦了。生成高质量的合成训练数据,既费钱又费时,还得搭建复杂的测试基础设施来验证代码正确性。这直接把小团队和个人开发者拒之门外。
Ai2 这次就是来砸场子的。他们发布的 Open Coding Agents,核心就一个目标:让任何人都能用极低的成本,训练出懂自己私有代码库的Agent。
不追求“完美”,只追求“够用”
SERA(Soft-verified Efficient Repository Agents)是怎么把成本打下来的?
Ai2 搞了个极其反直觉的操作:Soft-verified generation(软验证生成)。
以前训练代码模型,必须生成“完全正确”的代码对。这就像教学生写作业,必须每道题都100分才能拿去当教材,验证成本极高。
Ai2 发现:没必要。
只要补丁是“部分正确”的,就能拿来训练。就像不同的代码路径能通向同一个正确答案,那些不完美的代码修改,照样能教会Agent怎么修Bug。
这个发现直接砍掉了昂贵的测试验证环节。
配合一个包含51种常见Bug模式的“菜单”,SERA 能在一个只有几千个函数的仓库里,瞬间生成数万个多样化的Agent训练轨迹。
结果很残暴:复现此前最佳开源模型的性能,成本只要 400美元;想达到行业顶尖闭源模型的水准,也就 1.2万美元。
比之前的合成数据方法便宜了 57倍,比开源强化学习系统便宜了 26倍。
小模型也能“欺负”大模型
虽然评论区有眼尖的网友指出,Meta 的 CWM 模型在 SWE-Bench 上其实跑到了 65%,比 SERA 的 54.2% 更高。Ai2 在对比表中“遗忘”了这位强劲对手,确实有点“鸡贼”。
但这掩盖不了 SERA 真正的杀手锏:私有代码库的微调能力。
这才是企业最关心的痛点。
在针对 Django 和 Sympy 这类大型代码库的测试中,奇迹发生了。
一个 32B 参数 的 SERA 模型,在经过针对特定代码库的微调后,竟然打败了它的 110B 参数“老师”(GLM-4.5-Air)。
在 Django 项目上,SERA-32B 拿到了 52.23% 的分数,而 110B 的老师只有 51.20%。
这意味着什么?
意味着在特定的私有领地上,小而美的专精模型,完全可以吊打大而全的通用模型。
对于小团队来说,这简直是降维打击。你不需要养一个千亿参数的庞然大物,只需要花几百美元,就能得到一个比你内部资深工程师还懂自家代码库的AI助手。
速度与激情:每秒8600 Tokens
除了便宜,SERA 还快得离谱。
Ai2 联手 NVIDIA 做了极致的推理优化。
在 4x H100 GPU 上跑 BF16 精度,峰值输出速度能达到 1,950 tokens/秒。
如果换成 FP8 精度,速度飙升到 3,700 tokens/秒,而且精度几乎不掉。
最夸张的是在 NVIDIA 最新的 Blackwell 4xB200 系统上,SERA 能跑到 8,600 tokens/秒。
这是什么概念?你眨一下眼,它已经写完了一整篇论文。
这种速度,让它在生产环境里不仅好用,而且“即时”。
全家桶开源,最后的倔强
Ai2 这次做得最绝的一点是:全开源。
模型权重、训练代码、生成的Agent数据、甚至完整的训练配方,全部放出来了。
你不需要懂复杂的RL(强化学习)基础设施,也不需要庞大的工程团队,只要会跑简单的 SFT(监督微调),就能复现他们的结果。
甚至连部署都简化到了极致,两行代码就能启动推理服务器,直接兼容 Claude Code。
在这个大家都把模型捂得严严实实的时代,Ai2 这种“莽夫式”的开源,反而显得格外珍贵。
或许,AI 的未来不在于那几个被巨头垄断的超级黑盒,而在于千千万万个、跑在私有数据上的、便宜又好用的“小而美”。
当训练一个顶级代码Agent的成本降到400美元,这场游戏的规则,可能真的要变了。
参考链接:
https://allenai.org/blog/open-coding-agents