老实讲,看到这个新闻的时候,我脑子里蹦出来的第一个念头是《黑客帝国》。
这感觉太像了。Google DeepMind 这帮人,刚刚把一个叫做 Project Genie 的实验性原型扔给了公众。这玩意儿能干啥?它能让你凭空创造一个“活”的世界,然后跳进去,像做梦一样在里面瞎逛。
这可不是什么简单的 3D 绘图工具,它是一个能预测未来、模拟物理规则的“世界模型”。今天起,美国的 Google AI Ultra 订阅用户(18 岁以上)就能玩到了。虽然现在还是个原型,但我嗅到了一股不一样的味道——这可能是通向 AGI 的那条隐秘小径。
这不是游戏,是“造物主”的试炼场
我们先来搞清楚 Google 到底放了什么大招。
这几个月,DeepMind 一直在搞 Genie 3,一个通用的世界模型。简单说,以前的 AI 是生成一张死图,Genie 是生成一个能动的、有因果逻辑的环境。现在的 Project Genie,就是把这个模型塞进了一个网页应用里,还顺手拉上了 Gemini 和 Nano Banana Pro 来帮忙。
它的核心玩法就三个词,听着简单,但细思极恐:
World Sketching(世界草图):你扔给它一张图,或者一段文字,它就能给你变出一个活生生的场景。你想当个超级英雄,或者想在甜甜圈店里飞,都行。有意思的是,它还集成了 Nano Banana Pro,让你在“跳进去”之前,能像上帝一样微调你的世界,甚至决定是用第一人称还是第三人称去体验。World Exploration(世界探索):这是最骚的。你在这个世界里走的每一步,前面生成的路都是实时的。不是预先做好的地图,是你走到哪,它生成到哪。
World Remixing(世界混剪):觉得别人的世界不够酷?直接拿过来改。或者去画廊里找灵感,在别人的梦境上继续做梦。
说实话,这听起来比现在的任何开放世界游戏都要狂野。
你走过的路,不再是“一次性的”
很多人可能没意识到这背后的技术难度有多大。我看了一圈早期的测试视频,有人在城市里散步,有人在开直升机,甚至有人在模拟操作一台笔记本电脑。
真正的技术突破其实在这里:
网友 @fofrAI 分享的视频里,用户在模拟飞行;
另一个用户甚至重现了空间站和 Dunkin' Donuts 甜甜圈店。
但最让我震惊的,是评论区里一位高手的洞察。
**“Genie 真正的突破在于,当你转身回头看时,看到的场景和你刚才离开时是一模一样的。”**这点太关键了。之前的很多 AI 模拟器,只能往前走,一回头就露馅,或者直接崩坏。因为要保持“视线外”物体的连贯性,对模型的“记忆力”和一致性要求极高。
Genie 做到了。它不仅能生成前面的路,还能记住你身后的世界。这意味着它构建的空间,不再是那种骗骗眼睛的布景,而是一个逻辑自洽的立体宇宙。
给机器人的“想象力”
但这事儿没那么简单。
很多人看完视频,第一反应是:“哇,游戏要变天了。”我个人觉得,把 Genie 当成游戏引擎,格局小了。评论区里有人一针见血地指出:Genie 的目标不是做游戏,而是做下一代 AI 和机器人的“想象力”。
这是什么意思?
现在的机器人,你要让它拿起杯子,它得真去拿。但在 Genie 这样的“世界模型”里,AI 可以在脑子里先模拟一万次“拿杯子”的过程——预测动作的结果,训练自己的决策。
这就像人类下棋前在脑子里推演一样。DeepMind 搞这个,是为了让 AI 具备模拟现实物理世界的能力,这是通往 AGI 的必经之路。有人甚至把这联系到了 Andy Clark 的《体验机器》理论:我们人类的大脑,本质上就是一个高保真的生成模型,我们以为看到的现实,其实是大脑根据感官输入“脑补”出来的预测。
现在,DeepMind 试图在硅基芯片上复刻这个过程。
美中不足:它还在“梦游”
当然,别急着兴奋过头。
Project Genie 现在还只是个 Google Labs 里的“实验性研究原型”。说白了,就是个半成品。DeepMind 自己也很诚实,直接列了一堆“已知 Bug”:
- 物理不准:生成的世界可能看着假,或者不遵守牛顿定律。
- 控制延迟:有时候你想往左,角色反应不过来,或者不听使唤。
- 时间限制:一次只能玩 60 秒。
而且,8 月宣布的一些酷炫功能,比如“可提示事件”(比如你走到某个地方,世界突然发生巨变),这次还没放进去。
这确实有点遗憾,但也说明这技术还在 infancy(婴儿期)。## 现实与虚拟的边界正在模糊
尽管有这么多限制,但我依然觉得这事儿挺不真实的。
想想看,孩子们以后可以在自己的房间里,变成玩偶在虚拟世界里乱跑;或者我们可以重现历史上的某个瞬间,走进去看看。
一位网友的评论让我印象深刻:
“看得越多,我就越想放下屏幕,去现实世界里做那些我爱做的事。”
这是一种很自然的防御机制。当虚拟世界变得足够诱人,真实世界的“颗粒度”反而成了一种慰藉。
但不管怎么说,大门已经推开了。Google DeepMind 正在邀请一小部分人,去试探这个“无限世界”的边界。
等到 60 秒的限制被取消,等到物理引擎变得完美无缺,等到我们可以在里面生活一辈子……
那时候,我们还能分得清,哪个是 Genie 生成的世界,哪个是真实的吗?
参考链接:
https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/