2026年3月,GTC大会。
黄仁勋站在台上,扔出一颗炸弹:"CPU不再是简单地支持模型——它在驱动模型。"
全场哗然。
要知道,过去十年,整个科技行业都在讲一个故事:GPU是AI的引擎,CPU只是配角。NVIDIA靠GPU市值冲上三万亿美金,把Intel按在地上摩擦。几乎所有人都接受了——AI时代,GPU才是主角。
结果呢?
NVIDIA现在说,我要自己造CPU了。而且是"世界上第一款专为代理AI设计"的处理器。
这剧本,是不是有点眼熟?
88个ARM核心,一个大胆的赌注
Vera CPU的参数很硬。
88个NVIDIA定制的Olympus核心,ARM v9架构。单线程性能和每核带宽,官方说法是"业界最高"。内存用LPDDR5X,带宽1.2 TB/s,是传统CPU的两倍,功耗只有一半。
有点东西。
但更狠的是这张图:一个Vera机架,集成256个液冷CPU,能同时跑22,500个并发CPU环境。每个环境独立运行,全性能输出。
22,500个。
什么概念?相当于一个机架能撑起一座小城市的AI代理同时工作。
跟GPU的连接更夸张。NVLink-C2C互连,1.8 TB/s带宽。官方对比:PCIe Gen 6的7倍。
7倍。
这意味着CPU和GPU之间不再是"喊话"的关系,而是"光速传话"。
阿里、字节、Meta、Oracle:全来了
看一份名单。
云服务商:阿里、字节跳动、Meta、Oracle Cloud、CoreWeave、Lambda、Nebius、Nscale……基本上除了AWS和Google,能叫得上号的都在列。
硬件厂商:Dell、HPE、Lenovo、Supermicro、华硕、富士康、技嘉……服务器圈子的半壁江山。
国家实验室:德州超算中心、劳伦斯伯克利国家实验室、洛斯阿拉莫斯国家实验室……这些用超算搞核模拟、气候预测的机构,也排队要货。
有意思的是Cursor和Redpanda这两家应用层公司。
Cursor做AI编程工具,CEO说用Vera能"提升整体吞吐量和效率,让客户的编码代理体验更快、更响应"。
Redpanda更直接,拿Vera跑Apache Kafka兼容的工作负载,测出5.5倍的延迟下降。
CEO Alex Gallego说了句大实话:"Vera代表了CPU架构的新方向,每个核心有更多内存、更少开销。"
等等,CPU到底在AI里干嘛?
这是个关键问题。
很多人疑惑:AI时代,GPU不是万能的吗?CPU还能翻出什么浪花?
答案在"代理"两个字上。
传统的AI模型,比如ChatGPT,你问一句,它答一句。单线程,串行,没CPU什么事。
但代理AI不一样。它要规划任务、调用工具、操作数据、写代码、验证结果。一套流程下来,涉及大量调度、协调、IO密集型的活儿。
这些活儿,GPU不擅长。GPU擅长的是大规模并行计算,但代理AI的瓶颈往往在于"等待"——等数据库返回、等API响应、等下一个任务分配。
CPU的强项是什么?低延迟、高吞吐、灵活调度。
所以NVIDIA的逻辑很清晰:代理AI时代,CPU不再是"打杂的",而是"指挥官"。
黄仁勋说:"随着智能变得具有代理性——能够推理和行动——编排这些工作的系统重要性被提升了。"
翻译成人话:GPU是引擎,CPU是司机。引擎再强,司机不行,车也上不了路。
一个隐藏的反转
注意到名单里没有谁吗?
Intel和AMD。
这对x86双雄,几乎缺席了整个叙事。
NVIDIA用ARM架构造CPU,本质上是在说:我不想跟你们玩你们的游戏了,我直接换桌。
有Reddit网友说得更直接:"Intel已经失去了苹果,现在在消费级市场也没有竞争力。我看不出他们怎么在数据中心大规模新建设中增长。"
虽然话糙,但理不糙。
数据中心正在经历一场"范式转移"。以前是x86的天下,现在NVIDIA用"GPU+自研CPU"的组合拳,要把整个生态重新定义。
而且这批新机架,用的是NVIDIA的MGX模块化参考架构,全球80个合作伙伴一起造。
什么意思?NVIDIA不自己生产硬件,它输出标准,其他厂商负责落地。
这套打法,像极了当年ARM在移动端的生态策略。
我的两个疑问
第一,ARM架构在数据中心的生态,真能扛得住吗?
企业级软件对x86的依赖不是一天两天了。迁移成本、兼容性、运维习惯……这些都是硬骨头。NVIDIA能说服多少企业"叛变",有待观察。
第二,价格。
官方没说具体定价,但"液冷机架"、"22,500并发环境"这种规格,听起来就不是给中小企业准备的。
这究竟是"AI民主化"的开始,还是进一步拉大算力鸿沟?
最后
Vera CPU这件事,本质上是NVIDIA的一次"版图扩张"。
它已经坐稳了GPU的王座,现在要把CPU也纳入版图。两条腿走路,代理AI时代通吃。
黄仁勋在新闻稿里写:"Vera到来之际,正是AI的转折点。"
这话说得漂亮。
但真正的转折点,可能要等2026年下半年正式供货之后才能见分晓。
到那时候,是骡子是马,遛遛就知道。
【MiniMax-M2.1锐评】:NVIDIA这波操作,属于"我造不出GPU的替代品,但我能重新定义CPU的角色"。至于ARM生态能不能扛住企业级市场的硬需求,时间会给我们答案。
参考链接:
https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai