100万颗芯片集群,3倍性能暴击,但Google却在给Nvidia"上供"?
Google Cloud扔出了一枚炸弹。
第八代TPU来了。不是一颗,是两颗——TPU 8t负责训练,TPU 8i负责推理。官方口径很夸张:训练速度快3倍,每美元性能提升80%,最离谱的是,能把100万颗TPU串成一个集群。
这听起来像是要把Nvidia的老巢给端了?
别急。故事从这里才开始有趣。
分家,是为了更好的"过日子"
先搞清楚这两颗芯片是干嘛的。
TPU 8t,t代表training。这是用来"教"AI的,喂数据、调参数、让模型从笨蛋变聪明。TPU 8i,i代表inference。这是用来"用"AI的,你打开ChatGPT输入prompt那一刻,就是inference在工作。
Google把芯片劈成两半,意图很明显:训练要暴力堆算力,推理要省电省成本。一个专攻爆发力,一个专攻耐力。
这逻辑没毛病。毕竟现在AI公司的账单里,电费比程序员工资还让人肉疼。
"更多的算力,更少的能耗,对客户更低的成本"——Google Cloud的潜台词是:别去Nvidia那里排队买贵价卡了,看看我。
但等等。
最狠的"友商",往往坐在同一张桌子上
如果你以为这是Google对Nvidia的全面宣战,那就太天真了。
Google亲口承认:今年晚些时候,Nvidia最新的Vera Rubin芯片将在Google Cloud上线。不仅如此,两家还在偷偷搞一个叫做Falcon的软件网络项目,目标是让Nvidia的卡在Google的云里跑得更快、更顺滑。
这剧情反转得有点快。
前脚刚说自家TPU能省80%成本,后脚就给竞争对手铺红毯? hyperscalers(超大规模云厂商)这帮人精,算盘打得比谁都响。
现实是:Google的TPU不是来取代Nvidia的,是来"补充"的。
就像一家餐厅,既要有自家的招牌菜,也得有可口可乐。Google在告诉市场:我有自研芯片,但我也不跟Nvidia撕破脸,毕竟客户想要选择。
那个2016年的预言,成了科技圈最大的笑话
说到Nvidia,不得不提一个尴尬的历史。
芯片分析师Patrick Moorhead最近在X上自嘲:早在2016年Google发布第一代TPU时,他就预言这会是对Nvidia(和Intel)的"坏消息"。
九年过去了。
Nvidia市值从当时的几百亿飙到现在的近5万亿美元。Google的TPU已经迭代到了第八代,而Nvidia的护城河深得能养鱼。
Moorhead的预言没有应验,反而成了另一种证明:在AI芯片这场战争里,自研和通用不是零和游戏。
Google、Amazon、Microsoft都在造自己的芯片,但Nvidia的GPU依然是云厂商的现金奶牛。甚至有一种理论:Google Cloud的AI业务增长得越快,Nvidia卖出去的卡就越多。
因为企业上云之后,他们要的往往是"混合套餐"——既要用Google的TPU省钱,也要用Nvidia的GPU保底。
当"敌人"变成"合伙人"
最讽刺的莫过于Falcon项目。
这是Google在2023年开源的数据中心网络技术,现在却要拿来优化Nvidia系统的运行效率。两个科技巨头,一个是搜索霸主,一个是芯片皇帝,在开源项目的掩护下握手言和。
这让人想起那句话:没有永恒的敌人,只有永恒的利益。
Google需要Nvidia留住那些"非TPU不可"的高端客户;Nvidia需要Google Cloud这个巨大的分销渠道。TPU 8代再强,也只是菜单上的一道新菜,而不是把Nvidia踢出厨房。
所以回到开头那个问题:100万颗TPU集群是要端了谁的老巢?
答案可能是:谁的老巢都没端,只是让AI算力的蛋糕做得更大了。Google吃肉,Nvidia喝汤,或者反过来。
至于那些等着看"芯片世界大战"的观众,恐怕还得再等等。
毕竟在这个行业里,最大的战争往往看起来最像和平。
【锐评】: hyperscalers的自研芯片本质是"议价筹码"而非"替代方案",Google一边喊省钱80%一边拥抱Nvidia新卡,这套左右互搏术玩得比TPU集群调度还溜。
参考链接:
https://techcrunch.com/2026/04/22/google-cloud-next-new-tpu-ai-chips-compete-with-nvidia/