这家硅谷机器人公司融了 70 亿，连自己的机器人都控制不了

估值 56 亿美元。融了 10 亿+美金。正在谈新一轮融资，估值可能翻倍到 110 亿。

但最近，他们的论文里写了一句让整个 AI 圈有点兴奋的话：

“连我们自己都没想到，它能做到。”

一家成立两年的公司，一个才发布到 0.7 版本的模型，怎么就让一群每天和机器人打交道的研究者“傻眼”了？

它学会了一种“拼图”能力

先说清楚他们在做什么。

Physical Intelligence（简称 Pi）上周发了一篇论文，核心主角是一个叫 π0.7 的模型。

这不是一个只会端茶倒水的专用机器人——它想做的事，是造一个“通用机器人大脑”。什么意思？以前训练机器人是这么个流程：收集某个任务的数据，训练一个专门模型，再换下一个任务再训练一个。搬砖就搬砖，叠衣服就叠衣服，各干各的。

π0.7 试图打破这个模式。它的核心能力叫 组合泛化（compositional generalization）——把在不同地方学到的技能拼起来，去解决一个它从未见过的问题。

联合创始人 Sergey Levine（加州大学伯克利教授）原话是这么说的：

“一旦跨越了那个门槛——从只能做你收集数据的那点事，变成真的能以新的方式重组技能——能力的增长就不是线性的了。这种更有利的 Scaling 特性，我们在语言和视觉领域已经见过。”

听起来有点抽象？好，接下来这个例子，能让你直观感受到他们在激动什么。

一台空气炸锅，和两个“破碎”的训练数据

研究人员测试 π0.7 的方法之一是：给它一台空气炸锅，让它做一道烤红薯。

问题是，在整个训练数据里，和空气炸锅相关的只有两个片段：

一个视频里，另一个机器人只是把空气炸锅的盖子推了一下，关上。
另一个来自开源数据集，一个机器人把塑料瓶放进了空气炸锅。

就这么多。没有任何一个片段教它“怎么用空气炸锅做一顿饭”。

但 π0.7 把这两个碎片，加上从互联网预训练数据里学到的东西，拼在了一块。

零指导下，它尝试了一次，做得马马虎虎。研究人员试着用口语化的步骤指导它——就像你教一个新员工做事那样——成功了。

斯坦福计算机科学博士、Pi 研究员 Lucy Shi 说：

“知识到底从哪儿来的，什么时候会成功，什么时候会失败，这些都很难追踪。”

但她也说了一句更耐人寻味的话：

“有时候失败不是因为机器人或模型本身——而是我们自己。提示词工程没做好。”

5% 到 95%：一次“半小时”的逆袭

这里有个细节特别有意思。

一开始用空气炸锅那个任务，成功率只有 5%。

研究人员花了大约半小时，重新调整了怎么跟模型描述这个任务。

然后成功率飙升到 95%。

一个半小时的 prompt 调教，直接把一个“废物”变成了“熟练工”。

这意味着什么？未来你部署一个机器人到新环境，可能不需要重新收集数据、重新训练——只需要用自然语言跟它“聊”几分钟，它就能上手。

当然，模型现在还有明显的短板。你不能丢一句“去给我做顿烤吐司”就不管了。它需要你一步步带着走：

“把吐司放进这个槽，按这个按钮，等它弹出来。”

AI配图

Levine 承认：

“你不能直接告诉它，‘去做点吐司’。但如果你一步步带它，它通常能做得挺好。”

“我从业以来第一次真的被惊讶到”

整篇论文看下来，最让我印象深刻的不是某个具体的 demo，而是研究者自己的反应。

Pi 的研究员 Ashwin Balakrishna 说了这么一段话：

“我的经验是，当我非常清楚训练数据里有什么，我基本能猜到模型能做什么。很少会惊讶。但过去这几个月，是我第一次真的被惊到。”

他做了什么？他随便买了一套齿轮，然后问机器人：“你能转一下这个吗？”

它直接转了。

他根本不知道数据里有没有这个。模型自己“学会”了。

Balakrishna 说的这句话特别有画面感——就像当年 GPT-2 第一次写出“安第斯山脉的独角兽”故事，研究者自己都懵了：它从哪儿学会独角兽和秘鲁的组合的？

Levine 把这个时刻比作当年 LLM 出现“涌现能力”的瞬间：

“在机器人身上看到这种情况，真的很特别。”

“机器人没做后空翻，那是因为任务太无聊”

当然，质疑声不会少。

一个经典的反驳是：你们这些 demo 看起来都挺无聊的。机器人没有后空翻，没有花哨的特技。

Levine 直接回怼了这个观点：

“任何机器人泛化演示都可以被批评说任务很无聊。机器人没有做后空翻。”

但他接下来这句话很有分量：

“一个令人印象深刻的机器人 demo 和一个真正能泛化的机器人系统，区别恰恰就在这里。泛化 всегда看起来没那么戏剧性——但它更有用。”

这句话有点道理。你要一个会后空翻的机器人，还是一个能进你家厨房、听你指挥、第二天就能学会修下水道的机器人？

10 亿美金押注的，是一个“尚不存在”的东西

AI配图

说回钱。

Physical Intelligence 目前估值 56 亿美元，累计融资超过 10 亿。正在谈的新一轮融资，可能让估值冲到 110 亿。

投资人对一个尚未商业化、拒绝给出上市时间表的公司，为什么这么敢砸钱？

部分原因在于联合创始人 Lachy Groom。这位老兄是硅谷最成功的天使投资人之一，投过 Figma、Notion、Ramp。他后来决定亲自下场，认为 Physical Intelligence 就是他一直在找的那家公司。

于是钱进来了。

但说到底，所有人押注的，是一个尚不存在的东西——一个真正通用的机器人大脑。它可能还需要几年，可能还要解决数据瓶颈（机器人没有互联网可以用），可能还有很多次 5% 到 95% 的反复。

AI配图

Levine 被问到“什么时候能用上”时，拒绝猜测：

“我有充分的理由保持乐观。显然进展比我两三年前预期的快。但这个问题我很难回答。”

写在最后

π0.7 目前的定位是“早期信号”、“初步演示”。不是产品，不是 demo，是还在实验室里蹒跚学步的东西。

但它展示了一个微妙的转变：机器人开始会“拼图”了——不是单纯记忆，而是理解、组合、推理。

而最让人不安（也最让人兴奋）的一点或许是：

连造它的人，都不知道它下一步会学会什么。

【锐评】：这家公司的估值已经超过绝大多数上市公司，但它的产品甚至还没走出实验室——可当你看到研究员说“我第一次被自己做的模型惊讶到”的时候，你会觉得，或许这就是下一个时代的开始。

参考链接：
https://techcrunch.com/2026/04/16/physical-intelligence-a-hot-robotics-startup-says-its-new-robot-brain-can-figure-out-tasks-it-was-never-taught/