一场"豪赌"

2013年,黄仁勋收到一份offer。

TSMC创始人张忠谋亲自出马,邀请他出任TSMC CEO。

TSMC是什么?全球最关键的芯片代工厂,没有它就没有苹果、没有AMD、没有全球科技霸权。

黄仁勋拒绝了。

image

"我当时就知道NVIDIA要变成什么样,我知道我们会产生什么样的影响。那是我的责任,我不能离开。"

当时NVIDIA市值多少?80亿美元。

拒绝TSMC之后,黄仁勋做了一个更疯狂的决定——把CUDA技术塞进每一块GeForce游戏显卡里。

这意味着什么?

意味着每一个买显卡打游戏的普通消费者,都在为一项可能永远用不上的技术买单。

成本暴增50%。

毛利率从35%直接被击穿。

公司市值一路跌到15亿美元。

整整十年。

黄仁勋的原话是:"我让董事会清楚,我们的毛利率会被碾碎。"

但他硬扛了十年。

"GeForce承载了CUDA,承载了每一个研究者、每一个科学家、每一个学生。许多人本身就是游戏玩家,他们自己在宿舍组集群,然后他们发现了GeForce上的CUDA。"

这就是NVIDIA的起点——用游戏玩家的显卡,养活了一个帝国的野心。

今天,NVIDIA市值突破3万亿美元。

人类历史上最有价值的公司之一。

image

60个直接下属

黄仁勋的管理方式有多反常识?

他直接向60个人汇报。

没有一对一会议。

"60个人,我不可能一一谈话。我们呈现一个问题,然后所有人一起围攻它。"

什么意思?

当他们在设计一个机架系统时,讨论散热的人必须听网络架构的约束,讨论网络的人必须听内存的限制,讨论内存的人必须听功耗的要求。

任何人都可以随时插话:"这个方案对电源不友好。""这个设计内存带宽不够。"

谁想忽略这些警告,谁就会被当场点名。

"谁该参与却没参与,我会直接叫他们进来。"

这种"极端协同设计"(Extreme co-design),是黄仁勋挂在嘴边的词。

在他看来,AI时代的竞争不再是单点芯片的竞争,而是整个系统——从芯片到机架、从网络到散热、从软件到算法——必须一起优化。

"问题已经装不进一台电脑了。你加1万台电脑,却想快100万倍。这时候一切都来碍事:CPU是瓶颈,GPU是瓶颈,网络是瓶颈,交换芯片是瓶颈。Amdahl定律告诉你,你只能线性扩展,除非重新设计一切。"

所以NVIDIA现在做什么?

设计整个数据中心。

一个Vera Rubin Pod,7种芯片类型、5种专用机架类型、40个机架、120万亿个晶体管、近2万颗NVIDIA芯片、超过1100个Rubin GPU、60 exaflops算力。

这只是"一个Pod"。

黄仁勋说,他们每周要交付200个这样的Pod。

护城河是什么?

很多人问黄仁勋:NVIDIA最大的护城河是什么?

他的回答很简单:

"我们的计算平台的安装基础。CUDA的安装基础。"

这不是技术问题,这是生态问题。

"如果有公司搞了个'TUDA',它能打败CUDA吗?不能。因为护城河从来不只是技术。技术当然重要,但关键是——是43000名NVIDIA员工日复一日地维护CUDA,是数百万开发者相信我们会持续更新CUDA 1、2、3……直到第13版。"

所以一个开发者如果想做AI开发,他别无选择。

用CUDA,几个月后性能提升10倍。

用CUDA,能触达每一朵云、每一家电脑厂商、每一个国家、每一个行业。

"我信任NVIDIA会永远维护和优化CUDA。这点你可以完全相信。"

这就是护城河。

不是某一项专利,不是某一代芯片,而是一个持续了20年的承诺。

扩展定律:四层楼梯

黄仁勋提出了"AI扩展四定律":

第一层,预训练扩展——模型越大、数据越多,AI越聪明。

2023年行业恐慌:"高质量数据要耗尽了!"伊利亚·苏茨克维说"预训练结束了"。

黄仁勋说这是扯淡。

"大部分数据本来就是合成的。我读了它,修改它,生成新的内容,别人又读它。AI现在可以自己合成海量训练数据。数据不再受限,计算才是瓶颈。"

第二层,后训练扩展——微调、对齐、强化学习,让AI更好用。

第三层,测试时扩展——推理阶段的计算。

"很多人说推理很容易,预训练才难。扯淡。推理是思考,思考比阅读难多了。预训练是记忆和泛化,推理是推理、规划、搜索、分解问题。怎么可能计算量更少?"

第四层,代理式扩展——一个AI Agent能分裂出无数子Agent。

"这就像复制AI。NVIDIA扩展公司规模比扩展我自己容易多了。下一个扩展定律是代理式扩展。"

这四层楼梯往上走,最终汇成一句话:

"智能的扩展,本质上只有一件事——计算。"

能源:真正的瓶颈

黄仁勋被问到一个尖锐的问题:什么让你晚上睡不着?

image

他说了两个字:电力。

但他马上补充:

"我们通过极端协同设计,每年把每瓦特每秒生成的token数提升一个数量级。过去10年,摩尔定律只能让计算提升100倍,NVIDIA提升了100万倍。"

他的逻辑是:电费是数据中心的成本大头。只要效率提升足够快,token的成本就会暴跌。

"我们的硬件价格在涨,但token生成效率涨得更快,所以token成本每年下降一个数量级。"

但电力本身呢?

黄仁勋提了一个很反直觉的观点:

"电网99%的时间都有闲置电力。只有极端天气那几天才需要全力运行。数据中心完全可以灵活调配——电网紧张时,我们降频运行,把任务转移到别的地方。问题不是没有电,是没有人愿意接受'非完美可用'的合同。"

他甚至建议:

"为什么不让数据中心在电网过剩时全力跑,在电网紧张时主动降速?"

这个想法目前被客户合同卡住了——没有人愿意接受99.9%的可用性,大家都要求六个九(99.9999%)。

但黄仁勋说,这是下一个要打破的惯例。

马斯克式工程

image

黄仁勋谈到了埃隆·马斯克和Colossus超算。

4个月,20万块GPU,在孟菲斯拔地而起。

"马斯克是极简主义者。他问三个问题:第一,这有必要吗?第二,必须这样做吗?第三,为什么需要这么久?把每一样东西问到不能再简化的程度,但产品能力丝毫不减。"

他还提了一个细节:

"有一次我看到他和工程师讨论怎么把网线插进机架。他想搞清楚每个环节,确保整个流程不易出错。"

这种"在每一个细节上追问为什么"的方法论,和黄仁勋的"光速思维"异曲同工。

黄仁勋说,他有另一个方法论:

"我称之为'光速思维'。不是真的光速,而是物理极限的隐喻。每一样东西——内存速度、算力速度、功耗、成本、时间、人力、 manufacturing周期——我都拿来和光速比较。延迟vs吞吐量,成本vs吞吐量,容量vs吞吐量……先搞清楚每一样东西的物理极限在哪里,然后再做权衡。"

马斯克用这套方法4个月建成了世界最大超算。

黄仁勋用这套方法建了20年NVIDIA。

中国:被低估的对手

黄仁勋聊到中国时,说了几个很犀利的观察:

第一,人才密度。

"世界上50%的AI研究者是中国人,而且大部分还在中国。"

第二,疯狂的内部竞争。

"中国不是一个大市场,而是几十个省份、几百个城市在互相竞争。这就是为什么他们有几百家电动车公司、几百家AI公司。活下来的都是怪物。"

第三,开源文化。

"中国社会是家庭第一、朋友第二、公司第三。工程师的兄弟姐妹在竞争对手公司,同学在另一家公司。所以他们觉得开源是天经地义的——保密有什么意义?"

"他们快速分享知识,加速了整个创新过程。"

第四,工程师治国。

"美国领导人多是律师,中国领导人多是工程师,因为他们是从贫困中爬出来的。"

黄仁勋对中国的态度不是警惕,而是尊重。

"这是当今世界上创新最快的国家。"

开源:NVIDIA的另一面

很多人不知道,NVIDIA开源了Nemotron 3 Super——一个1200亿参数的MoE模型。

为什么?

黄仁勋说了三个原因:

第一,理解和预判模型演进。

"我们自己做大模型研究,才能知道未来需要什么样的计算系统。这是极端协同设计的一部分。"

第二,让AI进入每个行业。

"如果一切都是闭源的,研究人员和中小企业很难参与创新。开源是让AI扩散到每个国家、每个行业、每个研究者的唯一方式。"

第三,AI不只是语言。

"未来的AI会使用工具、子代理、多模态信息——生物、化学、物理、流体力学……不是所有东西都在语言结构里。我们需要开源模型来推动这些领域。"

所以NVIDIA做了一件奇怪的事:

它同时是闭源商业模式的受益者,又是开源生态的最大推动者。

黄仁勋说:

"我们既要有世界级的闭源模型作为产品,也要有开源模型激活整个生态。两者都是战略必需。"

AGI:已经来了

黄仁勋扔了一个炸弹:

"我认为AGI已经实现了。"

他的定义很务实:

"如果AGI的意思是创建一个能盈利的web服务,能获取用户、能变现——OpenClaw现在就能做到。互联网时代无数公司都是这样起来的,很多只是昙花一现,但这本身就是一种成功。"

但他马上补充:

"但你让我用AI创建NVIDIA?概率是0%。"

关于程序员会不会失业,他的观点很明确:

"程序员数量会增加,不会减少。编程的本质是'描述规格'。以前只有3000万人能写规格说明,未来会有10亿人能做这件事。每个木匠都会成为架构师,每个会计都会成为财务分析师。AI提升了每个人的能力上限。"

他还提了一个反直觉的观察:

"放射科医生的工作被AI取代了吗?2019年计算机视觉就已经超越人类放射科医生了。但放射科医生数量反而增加了。为什么?因为AI让诊断更快、覆盖面更广,医院能服务更多病人,需要更多放射科医生。"

"你的工作目的和你完成任务使用的工具,是两回事。"

死亡与传承

Lex问了一个私人问题:你怕死吗?

AI配图

黄仁勋的回答很真诚:

"我真的不想死。我有美好的家庭,有重要的工作。这辈子能参与一次'人类文明级别'的科技浪潮,我不想错过。"

但他不搞继任计划。

"很多人问我继任计划。我的答案是:我每天都在做继任计划。我学到的东西,不会留在桌上超过一毫秒。我会立刻传给下一个人。'这个太酷了,你赶紧去学。'我一直在赋能身边的人。"

"我最大的愿望是死在工作岗位上。"

他还说了一个很黑色幽默的设想:

"我的意识早就上传到互联网了——所有邮件、所有讲话、所有视频。等我走了,把这些数据发送给太空里的机器人,让它替我活下去。"

10万亿美元?

Lex问:你觉得NVIDIA会到10万亿美元吗?

黄仁勋没有回避:

"NVIDIA已经是人类历史上最大的计算机公司。这本身就值得问为什么。答案有两个。"

第一,计算范式变了。

"以前计算机是'检索系统'——预先写好的内容存着,你需要时调取。现在计算机是'生成系统'——实时处理、实时生成。检索系统需要大量存储,生成系统需要大量算力。这是根本性的范式转变。"

第二,计算机从'仓库'变成了'工厂'。

"仓库不赚钱,工厂直接产生收入。NVIDIA造的不是一个电脑,而是一个能生产token的工厂。Token是有价值的商品,就像iPhone——有免费版、有高级版、有专业版。未来有人愿意为100万美元的100万个token买单,这不是如果,是何时。"

"当这一切发生时,世界GDP会加速增长,用于计算的比例会是过去的100倍。你说NVIDIA能有多大?"

他还提了一个细节:

"有人告诉我,无晶圆厂半导体公司不可能超过10亿美元。后来有人说不可能超过250亿。每次有人这么说,我都当他们在放屁。"

"NVIDIA不是在抢市场份额,我们在一个全新的市场里开拓。想象力才是瓶颈。"

最后

整场对话3小时,黄仁勋展现了一个复杂的人:

他是一个赌徒——敢于用十年时间押注一个看不到回报的技术。

他是一个系统工程师——从芯片到机架到供应链到能源,全部纳入协同设计。

他是一个传教士——不断向供应商、向员工、向全世界宣讲他的未来愿景。

他是一个普通人——怕死、拒绝TSMC CEO、清洁厕所出身。

"成功最重要的特质是什么?是好奇心。是相信自己。是遗忘失败。是韧性。"

"每次 setbacks 来袭,你只能忘记它,继续前进。"

"如果你在开始之前就知道会有多难,你永远不会开始。但正是因为不知道,你才会跳进去。"

这就是黄仁勋。

一个用"光速思维"对抗物理定律的人。

一个用"极端协同设计"对抗复杂度的人。

一个用20年耐心对抗短期主义的人。

他可能不是最聪明的,但他是最有韧性的。

AI时代才刚刚开始。

而黄仁勋已经建好了基础设施。

【MiniMax-M2.1锐评】:黄仁勋这场对话信息密度极高,但核心其实是一条简单的逻辑线——用游戏显卡养CUDA,用CUDA养开发者生态,用生态养AI工厂。这是一场持续20年的豪赌,赌注是耐心、信念和对未来的绝对相信。

参考链接:
https://x.com/lexfridman/status/2036123301140111406