小米发布MiMo-V2-Pro：1万亿参数模型性能逼近GPT-5.2，成本仅1/7

小米这颗"万亿参数炸弹"，把OpenAI的定价表撕碎了

用七分之一的成本，买下接近GPT-5.2的智商——这不是促销，这是宣战。

当所有人还在盯着DeepSeek的R1复盘时，小米突然从车库里扔出了一颗核弹。MiMo-V2-Pro，一个拥有1万亿参数的基础模型，性能紧咬OpenAI和Anthropic的旗舰产品，但API价格却只有它们的六分之一，甚至七分之一。

更刺激的是，带队的是Fuli Luo——那个刚从DeepSeek R1项目走出来的技术老兵。他在X上轻描淡写地称之为一次**"安静的伏击"**。

说实话，看到这份定价表的时候，我手里的咖啡杯差点没拿稳。

从造车到造脑：小米的"垂直整合"野心

别误会，这不是某个AI初创公司的融资PR稿。

这是小米，那个卖手机、卖扫地机器人、现在还在卖SU7电动车的硬件巨兽。在全球第三大手机厂商的身份之外，小米现在想给你的不只是智能设备，而是设备背后的**"通用大脑"**。

MiMo-V2-Pro的野心很明确：不做陪你聊天的花瓶，要做能动手干活的"数字爪牙"。从写代码到操控终端，从管理供应链到自动驾驶决策，它想跳过"对话式AI"的初级阶段，直接杀进**"Agent时代"**。

AI配图

Fuli Luo团队的设计理念很硬件思维——既然小米能整合手机、汽车和家电，为什么不能整合一个能指挥这一切的AI中枢？

1万亿参数的"轻功"：稀疏架构的秘密

参数多不一定牛逼，用起来贵才是原罪。

MiMo-V2-Pro玩了一手漂亮的"障眼法"：虽然家里有1万亿个参数，但每次干活只叫醒42亿个。剩下的继续睡觉。这种稀疏架构让它比上一代Flash版本大了三倍，却远没有想象中那么"吃显卡"。

更狠的是那个7:1的混合注意力机制。

想象一下：以前的AI像学生，必须逐字逐句啃完一本书；而MiMo-V2-Pro像个老练的研究员，在图书馆里**"扫读"85%的内容抓大意，只精读15%的关键细节**。这让它能轻松吞下100万token的上下文（相当于好几本小说），而不会像传统Transformer那样算力爆炸。

再配上多token预测层，推理延迟被压得极低。Luo说这些架构决策几个月前就定好了，就为了等Agent爆发的这一刻。

说白了，这模型生来就不是为了陪你玩，是为了替你干活。

benchmark不会说谎，但价格会尖叫

看数据吧。

在GDPval-AA（真实世界Agent任务基准）上，MiMo-V2-Pro拿下了1426的Elo分，把中国同行GLM-5和Kimi K2.5甩在身后。虽然还没追上Claude Sonnet 4.6的1633，但已经是中国模型的最高纪录。

第三方机构Artificial Analysis的验证更扎眼：全球智能指数第10名，得分49，与GPT-5.2 Codex同档，还把Grok 4.20 Beta踩在了脚下。

关键指标 improvements：

幻觉率从Flash版的48%砍到30%
全知指数+5，领先GLM-5（+2）和Kimi K2.5（-8）
token效率极高：跑完整个测试只用了7700万输出token，而GLM-5花了1.09亿

在ClawEval（Agent脚手架测试）中，61.5分的成绩逼近Claude Opus 4.6（66.3），把GPT-5.2（50.0）远远甩开。Terminal-Bench 2.0编码测试86.7分，说明它真能稳定地在你电脑终端里执行命令。

但真正让CTO们坐不住的，是下面这张账单。

价格屠夫再现：当智能变得"白菜价"

跑一遍Artificial Analysis的智能指数测试要花多少钱？

MiMo-V2-Pro: $348
GPT-5.2: $2,304
Claude Opus 4.6: $2,486

七倍价差，性能却咬得很死。这不是"性价比"，这是**"价格重构"**。

看看API定价表（每百万token）：

模型	输入	输出	总成本
MiMo-V2-Pro (≤256K)	$1.00	$3.00	$4.00
Claude Opus 4.6	$5.00	$25.00	$30.00
GPT-5.4 Pro	$30.00	$180.00	$210.00

最高档上下文（256K-1M）也只要$2/$6 per million。缓存读取低至$0.20，写入暂时免费。

对于需要大规模部署的企业来说，这意味着什么？你可以用原来养一个GPT-5.2项目的预算，现在养七个MiMo-V2-Pro项目，还能剩钱买咖啡。

"行动空间" vs "聊天窗口"：AI的范式转移

有意思的是，小米刻意没做多模态。在这个"全能模型"（Omni）遍地跑的时代，MiMo-V2-Pro居然不支持图片输入——虽然官方暗示会有单独的MiMo-V2-Omni版本。

这种"残缺"恰恰暴露了它的战略定位：它不在乎陪你闲聊看图，它只想当你的"数字员工"。

AI配图

100万token的上下文窗口意味着什么？你可以把整个公司代码库、整份技术文档、整年财务报告一次性塞进去，不用切分、不用RAG碎片化。对于需要长期记忆、多步骤规划的复杂Agent工作流，这是降维打击。

但老实讲，这里有个暗雷。

开源承诺与安全隐患：狂欢下的阴影

Fuli Luo说会开源一个变体，"当模型足够稳定时"。

这个"当"字用得微妙。目前的Pro版本是闭源API-only，不像之前的Flash版本开放权重。对于安全团队来说，这成了双刃剑——虽然幻觉率降到了30%，但你无法做深度模型审计，只能依赖小米的安全协议。

更麻烦的是它的"Agentic"本性。既然它能操作终端、操控文件、执行代码， Prompt注入的风险就被放大了。给企业用？必须得配严密的监控和审计系统。

AI配图

我个人觉得，小米这波有点"先开枪后画靶"的意思。用超低价抢占开发者生态，用性能数据打动决策者，至于开源和安全，那是占领市场后才需要填的坑。

伏击之后，谁该失眠？

MiMo-V2-Pro在OpenRouter的"Hunter Alpha"测试期已经证明了市场需求。现在它在中国智能指数排第2，全球第8。

但真正的冲击不在于排名，而在于它证明了**"高质量Agent模型"不需要天价**。当小米这种拥有硬件、汽车、IoT生态的巨头开始认真做基础模型，AI的权力格局就不再是OpenAI和Anthropic的二人转。

从DeepSeek到MiMo-V2-Pro，中国AI公司正在用"工程优化+激进定价"的组合拳，把硅谷的商业模式按在地上摩擦。

问题已经不再是"这个模型会不会说话"，而是"它明天会不会替你上班"——以及，你老板会不会因为成本骤降而决定试试？

【kimi-k2.5锐评】：当造车的小米开始用1/7的价格卖GPT-5.2级别的智商，OpenAI的$200会员制看起来就像是在收"硅谷智商税"。

参考链接：
https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance