图注

估值 56 亿美元。融了 10 亿+美金。正在谈新一轮融资,估值可能翻倍到 110 亿。

但最近,他们的论文里写了一句让整个 AI 圈有点兴奋的话:

“连我们自己都没想到,它能做到。”

一家成立两年的公司,一个才发布到 0.7 版本的模型,怎么就让一群每天和机器人打交道的研究者“傻眼”了?


它学会了一种“拼图”能力

先说清楚他们在做什么。

Physical Intelligence(简称 Pi)上周发了一篇论文,核心主角是一个叫 π0.7 的模型。

这不是一个只会端茶倒水的专用机器人——它想做的事,是造一个“通用机器人大脑”。什么意思?以前训练机器人是这么个流程:收集某个任务的数据,训练一个专门模型,再换下一个任务再训练一个。搬砖就搬砖,叠衣服就叠衣服,各干各的。

π0.7 试图打破这个模式。它的核心能力叫 组合泛化(compositional generalization)——把在不同地方学到的技能拼起来,去解决一个它从未见过的问题。

联合创始人 Sergey Levine(加州大学伯克利教授)原话是这么说的:

“一旦跨越了那个门槛——从只能做你收集数据的那点事,变成真的能以新的方式重组技能——能力的增长就不是线性的了。这种更有利的 Scaling 特性,我们在语言和视觉领域已经见过。”

听起来有点抽象?好,接下来这个例子,能让你直观感受到他们在激动什么。


一台空气炸锅,和两个“破碎”的训练数据

研究人员测试 π0.7 的方法之一是:给它一台空气炸锅,让它做一道烤红薯。

问题是,在整个训练数据里,和空气炸锅相关的只有两个片段

  • 一个视频里,另一个机器人只是把空气炸锅的盖子推了一下,关上。
  • 另一个来自开源数据集,一个机器人把塑料瓶放进了空气炸锅。

就这么多。没有任何一个片段教它“怎么用空气炸锅做一顿饭”。

但 π0.7 把这两个碎片,加上从互联网预训练数据里学到的东西,拼在了一块

零指导下,它尝试了一次,做得马马虎虎。研究人员试着用口语化的步骤指导它——就像你教一个新员工做事那样——成功了

斯坦福计算机科学博士、Pi 研究员 Lucy Shi 说:

“知识到底从哪儿来的,什么时候会成功,什么时候会失败,这些都很难追踪。”

但她也说了一句更耐人寻味的话:

“有时候失败不是因为机器人或模型本身——而是我们自己。提示词工程没做好。”


5% 到 95%:一次“半小时”的逆袭

这里有个细节特别有意思。

一开始用空气炸锅那个任务,成功率只有 5%

研究人员花了大约半小时,重新调整了怎么跟模型描述这个任务。

然后成功率飙升到 95%

一个半小时的 prompt 调教,直接把一个“废物”变成了“熟练工”。

这意味着什么?未来你部署一个机器人到新环境,可能不需要重新收集数据、重新训练——只需要用自然语言跟它“聊”几分钟,它就能上手。

当然,模型现在还有明显的短板。你不能丢一句“去给我做顿烤吐司”就不管了。它需要你一步步带着走:

“把吐司放进这个槽,按这个按钮,等它弹出来。”

AI配图

Levine 承认:

“你不能直接告诉它,‘去做点吐司’。但如果你一步步带它,它通常能做得挺好。”


“我从业以来第一次真的被惊讶到”

整篇论文看下来,最让我印象深刻的不是某个具体的 demo,而是研究者自己的反应。

Pi 的研究员 Ashwin Balakrishna 说了这么一段话:

“我的经验是,当我非常清楚训练数据里有什么,我基本能猜到模型能做什么。很少会惊讶。但过去这几个月,是我第一次真的被惊到。”

他做了什么?他随便买了一套齿轮,然后问机器人:“你能转一下这个吗?”

它直接转了。

他根本不知道数据里有没有这个。模型自己“学会”了。

Balakrishna 说的这句话特别有画面感——就像当年 GPT-2 第一次写出“安第斯山脉的独角兽”故事,研究者自己都懵了:它从哪儿学会独角兽和秘鲁的组合的?

Levine 把这个时刻比作当年 LLM 出现“涌现能力”的瞬间:

“在机器人身上看到这种情况,真的很特别。”


“机器人没做后空翻,那是因为任务太无聊”

当然,质疑声不会少。

一个经典的反驳是:你们这些 demo 看起来都挺无聊的。机器人没有后空翻,没有花哨的特技。

Levine 直接回怼了这个观点:

“任何机器人泛化演示都可以被批评说任务很无聊。机器人没有做后空翻。”

但他接下来这句话很有分量:

“一个令人印象深刻的机器人 demo 和一个真正能泛化的机器人系统,区别恰恰就在这里。泛化 всегда看起来没那么戏剧性——但它更有用。”

这句话有点道理。你要一个会后空翻的机器人,还是一个能进你家厨房、听你指挥、第二天就能学会修下水道的机器人?


10 亿美金押注的,是一个“尚不存在”的东西

AI配图

说回钱。

Physical Intelligence 目前估值 56 亿美元,累计融资超过 10 亿。正在谈的新一轮融资,可能让估值冲到 110 亿

投资人对一个尚未商业化、拒绝给出上市时间表的公司,为什么这么敢砸钱?

部分原因在于联合创始人 Lachy Groom。这位老兄是硅谷最成功的天使投资人之一,投过 Figma、Notion、Ramp。他后来决定亲自下场,认为 Physical Intelligence 就是他一直在找的那家公司。

于是钱进来了。

但说到底,所有人押注的,是一个尚不存在的东西——一个真正通用的机器人大脑。它可能还需要几年,可能还要解决数据瓶颈(机器人没有互联网可以用),可能还有很多次 5% 到 95% 的反复。

AI配图

Levine 被问到“什么时候能用上”时,拒绝猜测:

“我有充分的理由保持乐观。显然进展比我两三年前预期的快。但这个问题我很难回答。”


写在最后

π0.7 目前的定位是“早期信号”、“初步演示”。不是产品,不是 demo,是还在实验室里蹒跚学步的东西。

但它展示了一个微妙的转变:机器人开始会“拼图”了——不是单纯记忆,而是理解、组合、推理。

而最让人不安(也最让人兴奋)的一点或许是:

连造它的人,都不知道它下一步会学会什么。


【锐评】:这家公司的估值已经超过绝大多数上市公司,但它的产品甚至还没走出实验室——可当你看到研究员说“我第一次被自己做的模型惊讶到”的时候,你会觉得,或许这就是下一个时代的开始。

参考链接:
https://techcrunch.com/2026/04/16/physical-intelligence-a-hot-robotics-startup-says-its-new-robot-brain-can-figure-out-tasks-it-was-never-taught/