大模型有个显而易见却又常被忽略的毛病:太大了。

image

大到不仅吃算力,还吃钱。很多企业看着前沿模型流口水,真要部署时却被成本吓得退避三舍。这给了西班牙一家初创公司可乘之机——既然模型太大用不起,那就把它“压缩”一下。

这家名为 Multiverse Computing 的公司,刚刚干了一件挺有野心的事:把 OpenAI 的模型体积砍掉一半,性能却几乎没掉,还顺带放话要拿融资、当独角兽。

压缩,压缩,还是压缩

说实话,现在的 AI 圈有点“以胖为美”的怪诞。

参数动辄千亿万亿,好像不大就不算好模型。但 Multiverse 偏要反其道而行。他们搞出了一种叫 CompactifAI 的压缩技术,据说是受量子计算启发(听着很玄乎,效果确实有点东西)。

image

最新的成果叫 HyperNova 60B 2602。

听名字就知道,这是个 600 亿参数级别的模型。它源自 OpenAI 的 gpt-oss-120b,但进化之后体积只有原版的一半,32GB。

内存占用低了,延迟低了,推理成本也下来了。最关键的是,Multiverse 声称它的能力和准确度几乎没打折。现在的这个新版本,甚至还支持工具调用和智能体编程,这可是目前最烧钱的推理场景。

开发者现在可以去 Hugging Face 上免费试用了。不得不说,这招“免费品尝”确实高明,毕竟好不好用,跑两圈代码就知道。

敢叫板 Mistral 的欧洲新贵

Multiverse 这一次不仅是冲着 OpenAI 去的,它还把矛头指向了欧洲 AI 的当红炸子鸡——Mistral。

(注:以前确实是当红炸子鸡,后来不知道干啥去了)

Multiverse 直接放话:HyperNova 60B 的表现击败了 Mistral Large 3。

image

这火药味一下子就上来了。要知道,Mistral 可是法国的 AI 门面,估值早已突破百亿美金大关。但这两家公司其实挺像的,颇有几分“欧洲双子星”的味道。

都是欧洲本土出身,都在大洋彼岸开了办公室,手里都握着一票企业客户。Multiverse 的名单里有西班牙伊贝尔德罗拉公司、博世,甚至还有加拿大央行。当然,最相似的还是钱。

拿着政府钱,讲着主权故事

Multiverse 目前还不是独角兽,但离这个头衔只差临门一脚。

传闻它正在筹集一笔 5 亿欧元的新融资,估值将超过 15 亿欧元。虽然公司对具体的金额和估值守口如瓶,只承认“正在和投资人谈”,但这种级别的传闻通常都不是空穴来风。

更有意思的是它的 ARR(年度经常性收入)。有报道称这一数字在今年 1 月已达 1 亿欧元。

这是什么概念?相比 OpenAI 那令人咋舌的 200 亿美元年收入,这 1 亿欧元确实只是个零头。 但如果对标 Mistral 的 4 亿欧元,差距似乎就没那么遥不可及了。

Multiverse 很聪明,它抓住了欧洲人最敏感的神经——“数字主权”

在它的叙事里,它是能提供“全栈主权解决方案”的公司。这招在欧洲百试百灵。去年它的 B 轮融资里,西班牙技术转型局(SETT)就参与了 2.15 亿美元。最近它又拿下了阿拉贡地区政府的合作项目。从巴斯克地区到加拿大,Multiverse 的背后站着渴望摆脱美国科技巨头依赖的欧洲力量。

变小,或许是变强的开始

虽然 Multiverse 计划在 2026 年开源更多模型,但这门“给大模型减肥”的生意,显然已经跑通了。

我个人觉得,这其实是 AI 行业走向成熟的标志。当狂热的参数竞赛告一段落,企业开始精打细算每一分算力成本时,“压缩”技术就会从边缘走向舞台中央。

毕竟,谁不想用一半的钱,跑出差不多的效果呢?

大模型很大,但未来的机会,可能藏在那些让它变“小”的人手里。

参考链接:
https://techcrunch.com/2026/02/24/spanish-soonicorn-multiverse-computing-releases-free-compressed-ai-model/