站在几英里外的沙漠眺望,大金字塔就像是一个指向星空的完美光滑三角体。
但只要你走到它的脚下,这种平滑的幻觉瞬间就会破灭。你看到的不是斜坡,而是由巨大、粗糙的石灰岩块堆砌而成的阶梯。
下次再听那些未来学家谈论“指数级增长”时,请记住这个画面。
摩尔定律是个美丽的谎言
英特尔联合创始人戈登·摩尔曾断言,微芯片上的晶体管数量每年都会翻倍。另一位英特尔高管后来将其修正为“计算能力每 18 个月翻一番”。很长一段时间里,英特尔的 CPU 都是这条定律的完美代言人。
直到增长曲线像一块石灰岩一样,突然变平了。
如果你把视角拉远,会发现下一块石头早就垫在那儿了——计算能力的增长只不过是从 CPU 转移到了 GPU 的世界。
英伟达 CEO 黄仁勋打了一场持久战,从游戏显卡到计算机视觉,再到生成式 AI,他一步步铺好了自己的台阶,成了最大的赢家。
技术增长从来不是百米冲刺,而是一段段冲刺后的停滞期。
现在的生成式 AI,也逃不过这个规律。
正如 Anthropic 的总裁 Dario Amodei 所说:
“指数增长会一直持续,直到它不再持续为止。每一年我们都在想,‘这不可能再继续指数增长了吧’——但每一年它都还在继续。”
但就像 CPU 遇到瓶颈、GPU 接力一样,大语言模型(LLM)的增长正在再次发生范式转移。
2024 年底,DeepSeek 用低得离谱的训练成本震惊了世界,部分原因就是他们用了 MoE(混合专家)技术。还记得最近你在哪儿见过这个词吗?
在英伟达 Rubin 的新闻稿里。技术描述中赫然写着:“...加速智能体 AI、高级推理和大规模 MoE 模型推理,每个 token 的成本降低高达 10 倍。”
黄仁勋比谁都清楚,想要维持那种令人垂涎的计算指数增长,光靠蛮力已经不够了。
有时候,你需要彻底改变架构,才能铺好下一块垫脚石。
没人愿意等机器人“想”太久
这就把 Groq 推到了舞台中央。2025 年,AI 推理能力的最大飞跃来自“推理时计算”。
说人话就是:让模型多想一会儿。
但时间就是金钱。消费者和企业的耐心是有限的。
Groq 拿出的杀手锏是闪电般的推理速度。
如果你把 DeepSeek 这种架构效率,和 Groq 的恐怖吞吐量结合在一起,你就能在指尖触碰最前沿的智能。
通过极速执行推理,你可以在没有延迟惩罚的情况下,用“更聪明”的系统击败竞争对手。
过去十年,GPU 是敲打每颗 AI 钉子的万能锤子。训练模型用 H100,跑模型也用 H100(或者是缩水版)。
但随着模型转向“system 2”思维——即 AI 在回答前会进行推理、自我纠错和迭代——计算负载变了。
训练需要大规模的并行蛮力,而推理,特别是推理模型,需要更快的顺序处理。
它必须瞬间生成 token,以支持复杂的思维链,而不是让用户盯着屏幕等待几分钟。
Groq 的 LPU(语言处理单元)架构,直接移除了困扰 GPU 在小批量推理时的内存带宽瓶颈。
速度,就是一切
对于高管们来说,这种潜在的融合解决了“思考时间”的延迟危机。
想象一下你对 AI 智能体的期待:自动订机票、独立编写整个 App、研究法律判例。
为了可靠地做到这些,模型在向用户输出一个字之前,可能需要在内部生成 10,000 个“思考 token” 来自我验证。
- 在标准 GPU 上: 这 10,000 个思考 token 可能需要 20 到 40 秒。用户早就关掉网页了。
- 在 Groq 上: 同样的思维链,发生在不到 2 秒内。如果英伟达整合了 Groq 的技术,他们就解决了“等机器人想明白”这个尴尬的问题。
他们保住了 AI 的魔法。
就像他们从“渲染像素”(游戏)跨越到“渲染智能”(生成式 AI),现在他们将跨越到实时渲染“推理”。
这就构成了恐怖的软件护城河
老实讲,Groq 最大的门槛一直是软件栈;而英伟达最核心的资产正是 CUDA。
如果英伟达用它的生态包裹 Groq 的硬件,他们实际上挖出了一条宽到竞争对手无法逾越的护城河。他们将提供万能平台:最好的训练环境,加上最高效的运行环境。
试想一下,把这种原始推理能力,配上下一代开源模型(比如传闻中的 DeepSeek 4):你会得到一个在成本、性能和速度上都能与今天最前沿模型匹敌的产品。
这对英伟达意味着什么?
意味着他们可以直接带着自己的云服务杀入推理业务,或者继续为那些呈指数级增长的客户提供动力。
下一块石头已经铺好
回到我们开头的隐喻:AI 的“指数级”增长,不是一条由原始算力(FLOPs)铺成的平滑直线,而是一段段被砸碎瓶颈后的阶梯。
- 第一块石头: 我们算得不够快。解法: GPU。
- 第二块石头: 我们训练得不够深。解法: Transformer 架构。
- 第三块石头: 我们“思考”得不够快。解法: Groq 的 LPU。
黄仁勋从来不怕为了掌控未来而“ cannibalize ”(吞噬/淘汰)自己的产品线。
通过认可 Groq,英伟达买的不仅仅是一块更快的芯片,他们是在把下一代智能带给大众。
这盘棋,才刚刚开始下到中盘。
参考链接:
https://venturebeat.com/infrastructure/nvidia-groq-and-the-limestone-race-to-real-time-ai-why-enterprises-win-or