2026年4月12日,MiniMax扔出一颗深水炸弹。
M2.7正式开源,SW E-Pro基准测试得分56.22%,Terminal Bench 2得分57.0%。
这些数字本身已经很漂亮了。但真正炸裂的,是藏在技术报告里的那行小字:
M2.7,是第一个"深度参与自身进化"的模型。
什么意思?
以前,AI是工具。人类写代码,训练模型,迭代版本。M2.7不一样——它自己优化自己,自己搭建实验框架,自己从实验结果里学习。
这已经不是"更强"的问题了。这是范式级的改变。
发生了什么
简单说,MiniMax让M2.7负责了一部分模型迭代的工作。
具体操作是这样的:研究人员给M2.7一个任务,M2.7自己查文献、跑数据、调代码、改架构,整个流程里它能处理30%-50%的工作量。
更夸张的是,MiniMax让M2.7自己优化自己的编程性能。M2.7完全自主运行,执行了100多轮"分析失败→规划改动→修改代码→运行评估→对比结果"的迭代循环。
最后,性能提升了30%。
一个模型,自己把自己变强了30%。
这还没完。MiniMax让M2.7去参加了22场机器学习竞赛,单卡A30就能跑的那种。
三轮24小时的自主进化后,最好的一次跑出了9金5银1铜,平均奖牌率66.6%。
这个成绩仅次于 Opus-4.6(75.7%)和 GPT-5.4(71.2%),跟 Gemini-3.1 持平。
3分钟修好生产故障
如果说"自我进化"听起来还有点抽象,那M2.7在真实生产环境里的表现就非常具体了。
官方给了一个例子:线上环境报警,需要排查故障。
传统流程里,这得一群人加班熬夜轮番排查。但M2.7直接上场:
- 关联监控指标和发布时间,做因果推理
- 对trace采样做统计分析,提出精确假设
- 主动连数据库验证根因
- 定位到代码库里缺失的索引迁移文件
- 甚至知道先用非阻塞索引创建把问题压住,再提MR
从分析到数据库再到SRE级决策,一条龙搞定。
多次把生产故障恢复时间压到3分钟以内。
这已经不只是一个"会写代码"的模型了。这是一个真正懂生产系统的AI工程师。
在纯编程能力上,M2.7在SWE-Pro上拿到56.22%,跟GPT-5.3-Codex打平。在更接近真实工程场景的SWE Multilingual上,更是跑出了76.5分。
VIBE-Pro(端到端项目级代码生成)得分55.6%,基本追上Opus 4.6。
也就是说扔一个Web需求、 Android需求、iOS需求给M2.7,它真能给你完整交付。
办公场景也杀疯了
别以为M2.7只会写代码。
在办公软件这个赛道,M2.7的表现同样离谱。
GDPval-AA评测里,45个模型同台竞技,M2.7的ELO得分1495,开源模型里最高。仅次于 Opus 4.6、Sonnet 4.6和GPT-5.4。
具体到Word、Excel、PPT这些日常办公场景,M2.7能直接根据模板生成文件,也能根据用户的多轮交互指令做精确修改。
官方扔了一个例子:让M2.7分析台积电的年报和财报电话会议,自己查多份研报,设计假设建财务模型,最后输出一份PPT和一份Word研究报告。
反馈是:可以直接当初稿用。
这意味着什么?一个junior分析师的活,AI能干了。
而且它不是那种"看起来像但不能用"的水平,是真能进工作流的。
在Toolathon上,M2.7准确率46.3%,全球第一梯队。MM Claw测试里,40多个复杂技能(每个超过2000 tokens),97%的指令遵循率。
你说它干活靠谱不靠谱。
社区炸锅了
消息发出去后,Twitter评论区瞬间热闹。
有人问跟Opus 4.6和GPT-5.4对比怎么样,有人问本地跑需要多少显存——
答:约140GB。
普通玩家基本告别本地运行了。
但更多人关注的点是:MiniMax说"开源",实际上许可证限制了商业用途。
"Congrats on releasing the model, but it's not open source by OSI definition. Read the first point. Your license is restricted for commercial use."
这波啊,这波算不算"开源"得打个问号。
不过技术本身确实硬核。9金5银1铜、3分钟修故障、97%技能遵循率——这些数据摆在那,绕不开。
写在最后
M2.7最让人头皮发麻的,不是56.22%的基准分,不是66.6%的奖牌率。
是那句话:"Model self-evolution"——模型自我进化。
以前我们说AI进化,意思是人类不断训练新版本。M2.7告诉你:不需要了,模型自己就能迭代自己,而且迭代出来的东西真能用。
30%的性能提升自己跑出来,100轮优化自己完成,22场竞赛自己打完。
这不是"更强"。
这是AI开始自己走自己的路了。
【锐评】:当AI开始自己优化自己,人类在训练链上的角色可能很快从"教练"变成"观众"。
参考链接:
https://x.com/MiniMax_AI/status/2043132047397659000