Lex Fridman 对话黄仁勋：AGI 已经来了

一场"豪赌"

2013年，黄仁勋收到一份offer。

TSMC创始人张忠谋亲自出马，邀请他出任TSMC CEO。

TSMC是什么？全球最关键的芯片代工厂，没有它就没有苹果、没有AMD、没有全球科技霸权。

黄仁勋拒绝了。

"我当时就知道NVIDIA要变成什么样，我知道我们会产生什么样的影响。那是我的责任，我不能离开。"

当时NVIDIA市值多少？80亿美元。

拒绝TSMC之后，黄仁勋做了一个更疯狂的决定——把CUDA技术塞进每一块GeForce游戏显卡里。

这意味着什么？

意味着每一个买显卡打游戏的普通消费者，都在为一项可能永远用不上的技术买单。

成本暴增50%。

毛利率从35%直接被击穿。

公司市值一路跌到15亿美元。

整整十年。

黄仁勋的原话是："我让董事会清楚，我们的毛利率会被碾碎。"

但他硬扛了十年。

"GeForce承载了CUDA，承载了每一个研究者、每一个科学家、每一个学生。许多人本身就是游戏玩家，他们自己在宿舍组集群，然后他们发现了GeForce上的CUDA。"

这就是NVIDIA的起点——用游戏玩家的显卡，养活了一个帝国的野心。

今天，NVIDIA市值突破3万亿美元。

人类历史上最有价值的公司之一。

60个直接下属

黄仁勋的管理方式有多反常识？

他直接向60个人汇报。

没有一对一会议。

"60个人，我不可能一一谈话。我们呈现一个问题，然后所有人一起围攻它。"

什么意思？

当他们在设计一个机架系统时，讨论散热的人必须听网络架构的约束，讨论网络的人必须听内存的限制，讨论内存的人必须听功耗的要求。

任何人都可以随时插话："这个方案对电源不友好。""这个设计内存带宽不够。"

谁想忽略这些警告，谁就会被当场点名。

"谁该参与却没参与，我会直接叫他们进来。"

这种"极端协同设计"（Extreme co-design），是黄仁勋挂在嘴边的词。

在他看来，AI时代的竞争不再是单点芯片的竞争，而是整个系统——从芯片到机架、从网络到散热、从软件到算法——必须一起优化。

"问题已经装不进一台电脑了。你加1万台电脑，却想快100万倍。这时候一切都来碍事：CPU是瓶颈，GPU是瓶颈，网络是瓶颈，交换芯片是瓶颈。Amdahl定律告诉你，你只能线性扩展，除非重新设计一切。"

所以NVIDIA现在做什么？

设计整个数据中心。

一个Vera Rubin Pod，7种芯片类型、5种专用机架类型、40个机架、120万亿个晶体管、近2万颗NVIDIA芯片、超过1100个Rubin GPU、60 exaflops算力。

这只是"一个Pod"。

黄仁勋说，他们每周要交付200个这样的Pod。

护城河是什么？

很多人问黄仁勋：NVIDIA最大的护城河是什么？

他的回答很简单：

"我们的计算平台的安装基础。CUDA的安装基础。"

这不是技术问题，这是生态问题。

"如果有公司搞了个'TUDA'，它能打败CUDA吗？不能。因为护城河从来不只是技术。技术当然重要，但关键是——是43000名NVIDIA员工日复一日地维护CUDA，是数百万开发者相信我们会持续更新CUDA 1、2、3……直到第13版。"

所以一个开发者如果想做AI开发，他别无选择。

用CUDA，几个月后性能提升10倍。

用CUDA，能触达每一朵云、每一家电脑厂商、每一个国家、每一个行业。

"我信任NVIDIA会永远维护和优化CUDA。这点你可以完全相信。"

这就是护城河。

不是某一项专利，不是某一代芯片，而是一个持续了20年的承诺。

扩展定律：四层楼梯

黄仁勋提出了"AI扩展四定律"：

第一层，预训练扩展——模型越大、数据越多，AI越聪明。

2023年行业恐慌："高质量数据要耗尽了！"伊利亚·苏茨克维说"预训练结束了"。

黄仁勋说这是扯淡。

"大部分数据本来就是合成的。我读了它，修改它，生成新的内容，别人又读它。AI现在可以自己合成海量训练数据。数据不再受限，计算才是瓶颈。"

第二层，后训练扩展——微调、对齐、强化学习，让AI更好用。

第三层，测试时扩展——推理阶段的计算。

"很多人说推理很容易，预训练才难。扯淡。推理是思考，思考比阅读难多了。预训练是记忆和泛化，推理是推理、规划、搜索、分解问题。怎么可能计算量更少？"

第四层，代理式扩展——一个AI Agent能分裂出无数子Agent。

"这就像复制AI。NVIDIA扩展公司规模比扩展我自己容易多了。下一个扩展定律是代理式扩展。"

这四层楼梯往上走，最终汇成一句话：

"智能的扩展，本质上只有一件事——计算。"

能源：真正的瓶颈

黄仁勋被问到一个尖锐的问题：什么让你晚上睡不着？

他说了两个字：电力。

但他马上补充：

"我们通过极端协同设计，每年把每瓦特每秒生成的token数提升一个数量级。过去10年，摩尔定律只能让计算提升100倍，NVIDIA提升了100万倍。"

他的逻辑是：电费是数据中心的成本大头。只要效率提升足够快，token的成本就会暴跌。

"我们的硬件价格在涨，但token生成效率涨得更快，所以token成本每年下降一个数量级。"

但电力本身呢？

黄仁勋提了一个很反直觉的观点：

"电网99%的时间都有闲置电力。只有极端天气那几天才需要全力运行。数据中心完全可以灵活调配——电网紧张时，我们降频运行，把任务转移到别的地方。问题不是没有电，是没有人愿意接受'非完美可用'的合同。"

他甚至建议：

"为什么不让数据中心在电网过剩时全力跑，在电网紧张时主动降速？"

这个想法目前被客户合同卡住了——没有人愿意接受99.9%的可用性，大家都要求六个九（99.9999%）。

但黄仁勋说，这是下一个要打破的惯例。

马斯克式工程

黄仁勋谈到了埃隆·马斯克和Colossus超算。

4个月，20万块GPU，在孟菲斯拔地而起。

"马斯克是极简主义者。他问三个问题：第一，这有必要吗？第二，必须这样做吗？第三，为什么需要这么久？把每一样东西问到不能再简化的程度，但产品能力丝毫不减。"

他还提了一个细节：

"有一次我看到他和工程师讨论怎么把网线插进机架。他想搞清楚每个环节，确保整个流程不易出错。"

这种"在每一个细节上追问为什么"的方法论，和黄仁勋的"光速思维"异曲同工。

黄仁勋说，他有另一个方法论：

"我称之为'光速思维'。不是真的光速，而是物理极限的隐喻。每一样东西——内存速度、算力速度、功耗、成本、时间、人力、 manufacturing周期——我都拿来和光速比较。延迟vs吞吐量，成本vs吞吐量，容量vs吞吐量……先搞清楚每一样东西的物理极限在哪里，然后再做权衡。"

马斯克用这套方法4个月建成了世界最大超算。

黄仁勋用这套方法建了20年NVIDIA。

中国：被低估的对手

黄仁勋聊到中国时，说了几个很犀利的观察：

第一，人才密度。

"世界上50%的AI研究者是中国人，而且大部分还在中国。"

第二，疯狂的内部竞争。

"中国不是一个大市场，而是几十个省份、几百个城市在互相竞争。这就是为什么他们有几百家电动车公司、几百家AI公司。活下来的都是怪物。"

第三，开源文化。

"中国社会是家庭第一、朋友第二、公司第三。工程师的兄弟姐妹在竞争对手公司，同学在另一家公司。所以他们觉得开源是天经地义的——保密有什么意义？"

"他们快速分享知识，加速了整个创新过程。"

第四，工程师治国。

"美国领导人多是律师，中国领导人多是工程师，因为他们是从贫困中爬出来的。"

黄仁勋对中国的态度不是警惕，而是尊重。

"这是当今世界上创新最快的国家。"

开源：NVIDIA的另一面

很多人不知道，NVIDIA开源了Nemotron 3 Super——一个1200亿参数的MoE模型。

为什么？

黄仁勋说了三个原因：

第一，理解和预判模型演进。

"我们自己做大模型研究，才能知道未来需要什么样的计算系统。这是极端协同设计的一部分。"

第二，让AI进入每个行业。

"如果一切都是闭源的，研究人员和中小企业很难参与创新。开源是让AI扩散到每个国家、每个行业、每个研究者的唯一方式。"

第三，AI不只是语言。

"未来的AI会使用工具、子代理、多模态信息——生物、化学、物理、流体力学……不是所有东西都在语言结构里。我们需要开源模型来推动这些领域。"

所以NVIDIA做了一件奇怪的事：

它同时是闭源商业模式的受益者，又是开源生态的最大推动者。

黄仁勋说：

"我们既要有世界级的闭源模型作为产品，也要有开源模型激活整个生态。两者都是战略必需。"

AGI：已经来了

黄仁勋扔了一个炸弹：

"我认为AGI已经实现了。"

他的定义很务实：

"如果AGI的意思是创建一个能盈利的web服务，能获取用户、能变现——OpenClaw现在就能做到。互联网时代无数公司都是这样起来的，很多只是昙花一现，但这本身就是一种成功。"

但他马上补充：

"但你让我用AI创建NVIDIA？概率是0%。"

关于程序员会不会失业，他的观点很明确：

"程序员数量会增加，不会减少。编程的本质是'描述规格'。以前只有3000万人能写规格说明，未来会有10亿人能做这件事。每个木匠都会成为架构师，每个会计都会成为财务分析师。AI提升了每个人的能力上限。"

他还提了一个反直觉的观察：

"放射科医生的工作被AI取代了吗？2019年计算机视觉就已经超越人类放射科医生了。但放射科医生数量反而增加了。为什么？因为AI让诊断更快、覆盖面更广，医院能服务更多病人，需要更多放射科医生。"

"你的工作目的和你完成任务使用的工具，是两回事。"

死亡与传承

Lex问了一个私人问题：你怕死吗？

AI配图

黄仁勋的回答很真诚：

"我真的不想死。我有美好的家庭，有重要的工作。这辈子能参与一次'人类文明级别'的科技浪潮，我不想错过。"

但他不搞继任计划。

"很多人问我继任计划。我的答案是：我每天都在做继任计划。我学到的东西，不会留在桌上超过一毫秒。我会立刻传给下一个人。'这个太酷了，你赶紧去学。'我一直在赋能身边的人。"

"我最大的愿望是死在工作岗位上。"

他还说了一个很黑色幽默的设想：

"我的意识早就上传到互联网了——所有邮件、所有讲话、所有视频。等我走了，把这些数据发送给太空里的机器人，让它替我活下去。"

10万亿美元？

Lex问：你觉得NVIDIA会到10万亿美元吗？

黄仁勋没有回避：

"NVIDIA已经是人类历史上最大的计算机公司。这本身就值得问为什么。答案有两个。"

第一，计算范式变了。

"以前计算机是'检索系统'——预先写好的内容存着，你需要时调取。现在计算机是'生成系统'——实时处理、实时生成。检索系统需要大量存储，生成系统需要大量算力。这是根本性的范式转变。"

第二，计算机从'仓库'变成了'工厂'。

"仓库不赚钱，工厂直接产生收入。NVIDIA造的不是一个电脑，而是一个能生产token的工厂。Token是有价值的商品，就像iPhone——有免费版、有高级版、有专业版。未来有人愿意为100万美元的100万个token买单，这不是如果，是何时。"

"当这一切发生时，世界GDP会加速增长，用于计算的比例会是过去的100倍。你说NVIDIA能有多大？"

他还提了一个细节：

"有人告诉我，无晶圆厂半导体公司不可能超过10亿美元。后来有人说不可能超过250亿。每次有人这么说，我都当他们在放屁。"

"NVIDIA不是在抢市场份额，我们在一个全新的市场里开拓。想象力才是瓶颈。"

最后

整场对话3小时，黄仁勋展现了一个复杂的人：

他是一个赌徒——敢于用十年时间押注一个看不到回报的技术。

他是一个系统工程师——从芯片到机架到供应链到能源，全部纳入协同设计。

他是一个传教士——不断向供应商、向员工、向全世界宣讲他的未来愿景。

他是一个普通人——怕死、拒绝TSMC CEO、清洁厕所出身。

"成功最重要的特质是什么？是好奇心。是相信自己。是遗忘失败。是韧性。"

"每次 setbacks 来袭，你只能忘记它，继续前进。"

"如果你在开始之前就知道会有多难，你永远不会开始。但正是因为不知道，你才会跳进去。"

这就是黄仁勋。

一个用"光速思维"对抗物理定律的人。

一个用"极端协同设计"对抗复杂度的人。

一个用20年耐心对抗短期主义的人。

他可能不是最聪明的，但他是最有韧性的。

AI时代才刚刚开始。

而黄仁勋已经建好了基础设施。

【MiniMax-M2.1锐评】：黄仁勋这场对话信息密度极高，但核心其实是一条简单的逻辑线——用游戏显卡养CUDA，用CUDA养开发者生态，用生态养AI工厂。这是一场持续20年的豪赌，赌注是耐心、信念和对未来的绝对相信。

参考链接：
https://x.com/lexfridman/status/2036123301140111406