小米这颗"万亿参数炸弹",把OpenAI的定价表撕碎了

用七分之一的成本,买下接近GPT-5.2的智商——这不是促销,这是宣战。

当所有人还在盯着DeepSeek的R1复盘时,小米突然从车库里扔出了一颗核弹。MiMo-V2-Pro,一个拥有1万亿参数的基础模型,性能紧咬OpenAI和Anthropic的旗舰产品,但API价格却只有它们的六分之一,甚至七分之一。

更刺激的是,带队的是Fuli Luo——那个刚从DeepSeek R1项目走出来的技术老兵。他在X上轻描淡写地称之为一次**"安静的伏击"**。

说实话,看到这份定价表的时候,我手里的咖啡杯差点没拿稳。

从造车到造脑:小米的"垂直整合"野心

别误会,这不是某个AI初创公司的融资PR稿。

这是小米,那个卖手机、卖扫地机器人、现在还在卖SU7电动车的硬件巨兽。在全球第三大手机厂商的身份之外,小米现在想给你的不只是智能设备,而是设备背后的**"通用大脑"**。

MiMo-V2-Pro的野心很明确:不做陪你聊天的花瓶,要做能动手干活的"数字爪牙"。从写代码到操控终端,从管理供应链到自动驾驶决策,它想跳过"对话式AI"的初级阶段,直接杀进**"Agent时代"**。

AI配图

Fuli Luo团队的设计理念很硬件思维——既然小米能整合手机、汽车和家电,为什么不能整合一个能指挥这一切的AI中枢?

1万亿参数的"轻功":稀疏架构的秘密

参数多不一定牛逼,用起来贵才是原罪。

MiMo-V2-Pro玩了一手漂亮的"障眼法":虽然家里有1万亿个参数,但每次干活只叫醒42亿个。剩下的继续睡觉。这种稀疏架构让它比上一代Flash版本大了三倍,却远没有想象中那么"吃显卡"。

更狠的是那个7:1的混合注意力机制

想象一下:以前的AI像学生,必须逐字逐句啃完一本书;而MiMo-V2-Pro像个老练的研究员,在图书馆里**"扫读"85%的内容抓大意,只精读15%的关键细节**。这让它能轻松吞下100万token的上下文(相当于好几本小说),而不会像传统Transformer那样算力爆炸。

再配上多token预测层,推理延迟被压得极低。Luo说这些架构决策几个月前就定好了,就为了等Agent爆发的这一刻。

说白了,这模型生来就不是为了陪你玩,是为了替你干活。

benchmark不会说谎,但价格会尖叫

看数据吧。

在GDPval-AA(真实世界Agent任务基准)上,MiMo-V2-Pro拿下了1426的Elo分,把中国同行GLM-5和Kimi K2.5甩在身后。虽然还没追上Claude Sonnet 4.6的1633,但已经是中国模型的最高纪录

第三方机构Artificial Analysis的验证更扎眼:全球智能指数第10名,得分49,与GPT-5.2 Codex同档,还把Grok 4.20 Beta踩在了脚下。

关键指标 improvements:

  • 幻觉率从Flash版的48%砍到30%
  • 全知指数+5,领先GLM-5(+2)和Kimi K2.5(-8)
  • token效率极高:跑完整个测试只用了7700万输出token,而GLM-5花了1.09亿

在ClawEval(Agent脚手架测试)中,61.5分的成绩逼近Claude Opus 4.6(66.3),把GPT-5.2(50.0)远远甩开。Terminal-Bench 2.0编码测试86.7分,说明它真能稳定地在你电脑终端里执行命令。

但真正让CTO们坐不住的,是下面这张账单。

价格屠夫再现:当智能变得"白菜价"

跑一遍Artificial Analysis的智能指数测试要花多少钱?

  • MiMo-V2-Pro: $348
  • GPT-5.2: $2,304
  • Claude Opus 4.6: $2,486

七倍价差,性能却咬得很死。这不是"性价比",这是**"价格重构"**。

看看API定价表(每百万token):

模型 输入 输出 总成本
MiMo-V2-Pro (≤256K) $1.00 $3.00 $4.00
Claude Opus 4.6 $5.00 $25.00 $30.00
GPT-5.4 Pro $30.00 $180.00 $210.00

最高档上下文(256K-1M)也只要$2/$6 per million。缓存读取低至$0.20,写入暂时免费。

对于需要大规模部署的企业来说,这意味着什么?你可以用原来养一个GPT-5.2项目的预算,现在养七个MiMo-V2-Pro项目,还能剩钱买咖啡。

"行动空间" vs "聊天窗口":AI的范式转移

有意思的是,小米刻意没做多模态。在这个"全能模型"(Omni)遍地跑的时代,MiMo-V2-Pro居然不支持图片输入——虽然官方暗示会有单独的MiMo-V2-Omni版本。

这种"残缺"恰恰暴露了它的战略定位:它不在乎陪你闲聊看图,它只想当你的"数字员工"。

AI配图

100万token的上下文窗口意味着什么?你可以把整个公司代码库、整份技术文档、整年财务报告一次性塞进去,不用切分、不用RAG碎片化。对于需要长期记忆、多步骤规划的复杂Agent工作流,这是降维打击。

但老实讲,这里有个暗雷。

开源承诺与安全隐患:狂欢下的阴影

Fuli Luo说会开源一个变体,"当模型足够稳定时"

这个"当"字用得微妙。目前的Pro版本是闭源API-only,不像之前的Flash版本开放权重。对于安全团队来说,这成了双刃剑——虽然幻觉率降到了30%,但你无法做深度模型审计,只能依赖小米的安全协议。

更麻烦的是它的"Agentic"本性。既然它能操作终端、操控文件、执行代码, Prompt注入的风险就被放大了。给企业用?必须得配严密的监控和审计系统。

AI配图

我个人觉得,小米这波有点"先开枪后画靶"的意思。用超低价抢占开发者生态,用性能数据打动决策者,至于开源和安全,那是占领市场后才需要填的坑。

伏击之后,谁该失眠?

MiMo-V2-Pro在OpenRouter的"Hunter Alpha"测试期已经证明了市场需求。现在它在中国智能指数排第2,全球第8。

但真正的冲击不在于排名,而在于它证明了**"高质量Agent模型"不需要天价**。当小米这种拥有硬件、汽车、IoT生态的巨头开始认真做基础模型,AI的权力格局就不再是OpenAI和Anthropic的二人转。

从DeepSeek到MiMo-V2-Pro,中国AI公司正在用"工程优化+激进定价"的组合拳,把硅谷的商业模式按在地上摩擦。

问题已经不再是"这个模型会不会说话",而是"它明天会不会替你上班"——以及,你老板会不会因为成本骤降而决定试试?

【kimi-k2.5锐评】:当造车的小米开始用1/7的价格卖GPT-5.2级别的智商,OpenAI的$200会员制看起来就像是在收"硅谷智商税"。

参考链接:
https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance