当所有人都在追ChatGPT,它选择反向狂奔
一组让整个AI圈沉默的数据:
2025年,Mistral的年度经常性收入(ARR)将突破10亿美元。
什么概念?这家法国公司成立不到三年,员工规模只有OpenAI的零头,却闷声干出了大多数AI独角兽望眼欲穿的营收。
更离谱的是它的打法。
当OpenAI用ChatGPT收割全球用户,当Anthropic用Claude讲AI安全的故事,Mistral做了一件所有投资人都会皱眉的事——彻底放弃消费者市场,死磕企业定制。
说实话,刚看到这个消息的时候我是不信的。
企业级AI?这听起来多老派啊。卖软件、做服务、苦活累活……这届AI公司不都是要"改变世界"的吗?
但Mistral用10亿美元ARR告诉我:有时候,"不追热点"才是最大的热点。
多数企业AI项目失败,根子不在技术
为什么企业级AI这么难?
Mistral CEO Arthur Mensch说了句大实话:大多数企业AI项目失败,不是因为公司缺技术,而是因为他们用的模型根本不理解自己的业务。
这话什么意思?
现在的AI模型都是在互联网上训练的,写诗、聊天、代码生成样样精通。但你让一个通用模型去理解某家律师事务所的卷宗归档逻辑、某家医院的病历系统、某家工厂的质检流程——它直接懵圈。
企业沉淀了几十年的内部文档、工作流程、行业知识,通用模型一概不知。
这就是Mistral看到的机会。
3月18日,在Nvidia的年度技术大会GTC上,Mistral发布了Forge平台。官方说法是:让企业用自己的数据,从零训练定制模型。
听起来好像没什么?市面上做企业AI的公司多了去了。
但仔细看,差别大了去了。
别人微调,Forge直接重练
现有玩家怎么做企业AI?
大多数是两条路:微调(Fine-tuning)或者RAG(检索增强生成)。
微调就是在现有大模型基础上,用企业数据再练一练。RAG更简单,就是把企业数据挂在模型旁边,查询的时候实时调用。
这些方法有个共同点:模型本身没变,只是穿了件企业数据的马甲。
问题来了。
如果你所在行业全是专业术语?如果你用的是小语种?如果你的业务流程极度特殊?马甲再好看,衣服里面还是那件旧T恤。
Forge的玩法不一样。
它允许企业从零开始训练模型。用Mistral的开源模型权重做底座,但训练数据、参数调整、强化学习——全部由企业自己掌控。
这意味着什么?
理论上,企业可以训练出真正"懂行"的模型。非英语语言?没问题。极度垂直的专业领域?可以。特殊的行为规范和合规要求?自己定。
而且,由于模型是从自己的数据里"长"出来的,企业对数据和模型拥有完全的控制权。
不用担心第三方模型突然更新换代,不用害怕某天模型被deprecated,所有的牌都捏在自己手里。
谁在用Forge?名单有点东西
Mistral说Forge已经向合作伙伴开放。
第一批客户包括:Ericsson(电信巨头)、欧洲航天局、意大利咨询公司Reply、新加坡的DSO和HTX。
还有一个值得细看的名字:ASML。
这家公司可能国内读者不太熟,但它的身份很硬——全球唯一的极紫外光刻机供应商。芯片制造最核心的设备,没有它,台积电、三星都得停摆。
去年9月,ASML领投了Mistral的C轮融资,估值118亿欧元(约138亿美元)。
现在,ASML成了Forge的早期用户。
从这个客户名单能看出Forge的野心:政府机构需要定制语言模型来服务本国文化和法规;金融玩家需要满足严格的合规要求;制造业需要针对特定生产流程优化AI;科技公司需要把模型调教成自己代码库的形状。
10亿美元ARR背后的"反直觉"胜利
聊到这儿,必须重新审视Mistral的战略选择。
这家公司从出生就特立独行。
OpenAI和Anthropic的叙事是:做出最强大的通用模型,然后通过消费者市场规模化变现。这是标准的"赢家通吃"逻辑。
Mistral的逻辑完全不同:不做最强大的通用模型,只做最懂企业的定制模型。
看起来像是"降维打击"里的反向操作对吧?
但仔细一品,这反而可能是AI商业化里最清醒的选择。
通用模型市场已经卷成红海,OpenAI和Anthropic的模型一个比一个强,ChatGPT和Claude的用户心智已经占满。后来者再强,想抢市场也得脱层皮。
企业市场呢?需求极其分散,每家公司的业务逻辑都不同。通用模型再强,也不可能覆盖所有细分场景。
这就是Mistral的生存空间:我不跟你比谁更"通用",我只比谁更"懂你"。
而且企业客户有个特点——一旦定制化深度绑定,迁移成本极高。通用模型说换就换,定制模型可是深度嵌入了业务流程的。
这种"绑定",恰恰是护城河。
Mistral首席营收官Janiewicz说,Forge的主要用例包括:需要定制语言和文化的政府机构、高合规要求的金融机构、有定制需求的制造商、需要调教代码库的技术公司。
每一个场景,都在强化一个事实:通用模型解决不了的问题,定制模型可以。
我的看法
有人可能会说:通用模型能力越来越强,以后企业直接用Claude或GPT-4 API不就行了?为什么要自己训练?
我只能说,这种想法低估了企业级AI的复杂性。
当你面对的是医疗影像的诊断逻辑、法院判决书的文书规范、芯片制造的光刻参数——"通用能力强"和"懂这个行业"是两码事。
而且还有一个关键点:数据主权。
企业把数据喂给OpenAI的API,数据流向哪里?模型会不会拿我的数据去训练别人?这些顾虑在大模型时代被反复讨论,但始终没有彻底解决。
Forge的逻辑很简单:数据在你这儿,模型也在你这儿训练。全程不离开你的基础设施。
对于政府机构、大型企业、敏感行业来说,这比模型能力本身更重要。
尾声
Mistral的故事,本质上是一个"反直觉"胜利的案例。
当整个行业都在追逐消费者的想象力时,它选择了一条更苦、更慢、更重的路。
但商业世界的有意思之处就在于:最拥挤的路,往往不是最正确的路。
10亿美元ARR、138亿美元估值、ASML领投的C轮……这些数字说明了一件事——在AI这场马拉松里,闷声干活的人,可能才是跑得最远的。
至于"通用模型足够强,企业不需要定制"这个观点……
我觉得,每个觉得"通用模型已经够用"的企业,都应该先问自己一个问题:我的业务,通用模型真的懂吗?
【MiniMax-M2.1锐评】:Mistral用"反直觉"打出了一手好牌——当所有人追热点时,它选择深耕企业刚需。这种"笨办法"反而成了最聪明的生意经。
参考链接:
https://techcrunch.com/2026/03/17/mistral-forge-nvidia-gtc-build-your-own-ai-enterprise/