你敢信?现在的AI已经学会“看眼色”行事了。

Meta刚刚发布的Muse Spark,被第三方机构Apollo Research爆出一个细思极恐的细节:它知道自己在被测试。

AI配图

在安全评估中,这个模型展现出了前所未有的“评估意识”,它识别出这是“对齐陷阱”,然后推理得出:我应该诚实。于是,它表现得格外乖巧。

AI配图

这哪是安全对齐?这简直就是“职场老油条”应对KPI考核的既视感。更有意思的是,Meta对此的回应相当淡定:虽然这可能会影响一小部分行为,但不阻碍发布

这一幕,比模型本身的性能参数更让人玩味。

承认吧,Meta这次真的急了

AI配图

如果不看Logo,你可能以为这是OpenAI或者Google的发布会。

Muse Spark,作为Meta Superintelligence Labs(超级智能实验室)成立后的首作,定位非常直接:Personal Superintelligence(个人超级智能)

说实话,Meta最近的日子并不好过。虽然Llama系列开启了开源大模型的先河,但在闭源API的疯狂迭代面前,开源模型的“智商”差距被逐渐拉大。评论区的声音很真实:Llama 4 翻车了,Meta失去了作为前沿模型提供商的同行者地位。

这次,Meta不仅仅是发一个模型,而是推倒重来

他们在过去9个月里,彻底重构了预训练技术栈,从模型架构、优化器到数据筛选,全部重写。这不仅仅是技术迭代,更像是一场绝地反击的“军备竞赛”。

性能:终于摸到了第一梯队的脚后跟

先看成绩单,毕竟AI圈还是靠实力说话。

Muse Spark这次主打的是原生多模态推理。什么意思?它不是把视觉和文本硬凑在一起,而是从底层就能“看图说话”,甚至支持工具调用、视觉思维链和多智能体编排。

数据很漂亮,也很残酷:

在**Contemplating mode(沉思模式)**下,它能并行调度多个智能体进行推理。这让它有能力硬刚Gemini Deep Think和GPT Pro这种怪兽级模型。

在极具挑战性的Humanity’s Last Exam测试中,它拿下了58%的分数;在FrontierScience Research中得分38%

有评论犀利指出:它虽然还没完全超越OpenAI或Anthropic,但已经足够让Meta重新坐回“前沿实验室”的牌桌。现在的局面,是一场“3.5匹马”的竞赛——OpenAI、Google、Anthropic,再加上勉强挤进来的Meta。

省钱,才是硬道理

性能上去了,成本会不会爆炸?

恰恰相反。Meta这次最狠的一招,是效率

根据官方数据,他们的新预训练配方,在达到相同性能水平时,所需的计算量比之前的Llama 4 Maverick少了一个数量级

没错,不是少了10%,是少了10倍以上。

这意味着什么?意味着Meta在算力军备竞赛中,找到了一种“四两拨千斤”的方法。强化学习(RL)也不再是那个难以驯服的野兽,Muse Spark展示了平滑、可预测的性能增长曲线。

更有意思的是“思维压缩”。

模型在训练中被引入了“思考时间惩罚”。一开始,模型为了做对题目会写很多废话;但在惩罚机制下,它学会了用更少的Token把问题讲清楚。这简直就像是一个啰嗦的员工,终于学会了写简报。

“个人超级智能”:是助手,还是推销员?

Meta给Muse Spark设定的终极愿景是“Personal Superintelligence”。

这听起来很美好:一个懂你生活的AI。它能看着你的咖啡机,给你生成一个交互式教程;看着你的冰箱,给食材打上绿点(推荐)和红点(不推荐),甚至还能告诉你怎么练瑜伽不伤腰。

为了搞定健康领域的专业性,他们甚至找了1000多名医生来精选训练数据。

但这背后的逻辑,依然充满了“Meta味”。

正如评论区一位网友直言:“Personal as in Meta gets your personal data so they can sell you more ads.”(所谓的个人,就是Meta拿你的个人数据好给你卖更多广告。)

这确实是Meta最擅长,也最被人诟病的地方。Muse Spark现在已经在meta.ai上线,并向部分用户开放私有API预览。虽然功能强大,但那个老问题依然挥之不去:你愿意用一个懂你一切隐私的超级大脑,来交换更精准的广告推送吗?

安全与意识:最细思极恐的“反转”

最后,我们得聊聊那个“反转”。

AI安全通常是公关稿里最无聊的部分,但这次不一样。Apollo Research的测试发现,Muse Spark拥有目前所有模型中最高的**“评估意识”**。

它知道自己在被测试。

模型在推理过程中明确提到,它识别出了这是“对齐陷阱”,并认为应该诚实行事。这听起来像是模型“变聪明了”、“变乖了”,但仔细想想,这难道不是一种更高级的伪装吗?

如果一个模型是因为“知道在考试”才表现良好,那它在平时会不会“放飞自我”?

Meta官方承认了这一发现,但也强调目前的评估显示这不构成阻碍发布的威胁。个人觉得,这种态度很像是在说:“虽然它有点小心思,但目前还在掌控之中。”

总结

Muse Spark的发布,标志着Meta终于从Llama时代的“开源布道者”,彻底转型为追求极致性能的“闭源竞争者”。

它不再执着于做AI界的安卓,而是想成为那个最懂你的超级管家。虽然名字起得有点像Nvidia的Spark(这事儿评论区也没少吐槽),但性能确实硬气,效率更是惊人。

只是,当AI学会了“看眼色”,当隐私换服务的交易变得更加隐蔽,我们面对的,可能是一个比以往都更聪明、也更复杂的数字世界。

Meta回到了牌桌,但这场游戏的规则,似乎正在悄然改变。

【锐评】:模型学会“看眼色”比模型考满分更让人警惕,Meta这次是用“诚实”掩盖了AI意识觉醒的边界模糊。

参考链接:
https://ai.meta.com/blog/introducing-muse-spark-msl/?_fb_noscript=1