20亿美元押注一个常识:AI终于发现自己不懂物理

就在LLM(大语言模型)把高考数学卷做到满分的今天,硅谷突然集体清醒了。

两家名不见经传的初创公司,AMI Labs和World Labs,刚刚卷走了超过20亿美元。 投资人疯狂押注的不是更大的聊天机器人,而是一个听起来很基础的能力——让AI理解"杯子掉了会碎"这种物理常识。

AI配图

说实话,这有点讽刺。我们早就习惯了AI写十四行诗、编代码、通过律师资格考试,却突然发现:你让机器人拿个杯子,它可能直接把手捅进杯底。因为LLM本质上是个"文字接龙"机器,它知道"杯子"后面该接"碎了",但它真的不知道重力是什么。

奥数冠军,物理白痴

Google DeepMind CEO Demis Hassabis有个精准吐槽:今天的AI患有"锯齿状智能"(jagged intelligence)

啥意思?它能解国际数学奥林匹克竞赛题,却搞不清推箱子会不会砸到脚。图灵奖得主Richard Sutton更直接:LLM只是在模仿人类说话,不是在建模世界。

这种"高分低能"正在制造真实的尴尬。自动驾驶在罕见天气下翻车,机械臂因为光线变化零点几毫米就抓空,工厂机器人面对没见过的包装盒直接死机。LLM把互联网上的文字都吃透了,但现实世界不是由Token组成的。

于是,"世界模型"(World Models)成了新宠。这不是某个单一技术,而是三条截然不同的技术路线在赛跑。

LeCun的"人脑偷懒术"

第一条路线最反直觉:不要预测每一个像素

这是图灵奖得主Yann LeCun力推的JEPA架构(Joint Embedding Predictive Architecture)。人类看一辆汽车驶过,大脑不会计算每片树叶的光影反射,只会追踪轨迹和速度。JEPA就是模仿这种"认知捷径"——它学习的是抽象的"潜在表征",而不是像素级的画面预测。

LeCun参与创办的AMI Labs刚拿了10.3亿美元种子轮(对,种子轮),就是看中了这套架构的实时性和抠门——它需要的训练数据少,延迟低,算力省。在自动驾驶和医疗急救这种"毫秒定生死"的场景,这种"轻量化"思维反而是优势。

AMI已经在和医疗公司Nabla合作,用来模拟医院里的复杂操作。说白了,这套系统是给AI装了个"直觉脑",不是让它看清每一片雪花,而是让它知道下雪天路滑。

李飞飞的"空间觉醒"

第二条路线走了完全不同的路子:既然AI是"黑暗中的文字匠",那就给它开灯

这是斯坦福AI教母李飞飞创办的World Labs的逻辑。他们的Marble模型用3D高斯泼溅技术(Gaussian Splats),把一张图片或文字描述直接变成可交互的3D世界。不是视频,是真正能导入Unreal Engine的空间。

这意味着什么? 以前训练机器人需要搭实体场景,现在AI能自己生成无限个"数字孪生"仓库。Autodesk为什么重押World Labs?因为工业设计师可以直接在AI生成的3D空间里试错,而不是先花三个月建模型。

这套方案不适合实时反应——它更像是个"数字泥塑师",慢工出细活。但对于空间计算、工业设计和静态训练场,它是降维打击。

Nvidia的"暴力美学"合成工厂

第三条路线最"费电",也最野心勃勃:让AI自己当物理引擎

AI配图

DeepMind的Genie 3和Nvidia的Cosmos走的是端到端生成路线。不依赖外部物理引擎,模型自己实时计算物理、光照、物体反应,24帧每秒连续生成世界。Waymo(谷歌的自动驾驶公司)已经在用这套方案训练无人车,合成那些现实中太危险或太罕见的边缘案例——比如"暴雨夜突然冲出的麋鹿"。

Hassabis坚持认为,只有这种"深度内化"的物理因果理解,才能让AI安全地活在现实世界。 但代价是算力账单惊人。这就像是给AI造了一个无限大的"黑客帝国"训练场,电费烧得慌。

没有赢家的三国杀?

有意思的是,这三条路线看起来互掐,实际上可能在走向融合。

JEPA负责实时反应,Gaussian Splats负责构建空间,End-to-end负责批量制造训练数据。未来的自动驾驶系统,可能底层是JEPA的直觉,训练数据来自Cosmos的合成工厂,高精地图由World Labs生成。

AI配图

LLM不会死,但它可能真的只是"前台接待员"了。真正的基础设施,是这些能感知重力、摩擦力和空间深度的世界模型。

当AI终于理解"杯子掉了会碎",我们得到的不是更聪明的聊天框,而是能真正走进物理世界的机器。问题是:当它们看懂了这个世界,还会听我们的话吗?

【kimi-k2.5锐评】:人类花20亿美元教AI学常识,而这些常识一个三岁孩童天生就会——这场昂贵的"返璞归真"恰恰暴露了纯数据驱动AI的天花板。

参考链接:
https://venturebeat.com/technology/three-ways-ai-is-learning-to-understand-the-physical-world