封面图

2025年,行业还在为GPT-5的参数规模争论不休;2026年,战局已经悄悄转移了。

MiniMax刚公布了M3模型的稀疏注意力机制,15.6倍的长上下文解码加速听起来很猛。Anthropic被曝即将迎来首个盈利季度,靠的不是什么颠覆性模型,而是把API价格悄悄涨了上去。Richard Socher拿了3亿美元押注RSI(递归自我改进),Karpathy在GitHub上开源了一个用AI训练GPT-2的项目。听起来都很炸裂,对吧?

但与此同时,默克和万事达的真实案例泼了一盆冷水——他们不是在追逐什么RSI或M3,他们花在AI项目上最多的时间,是先把数据管道修好

这两个画面的对撞,构成了2026年AI行业最核心的张力:技术一边狂飙,应用一边补课。

效率革命:长上下文成本终于要降了?

让我们先看看MiniMax M3的技术突破。

他们预告的稀疏注意力机制,本质上是在解决一个问题:当你把一百万token塞进模型,推理成本会爆炸。传统Transformer的注意力机制是O(n²)复杂度,token越多,计算量涨得比指数还凶。

MiniMax的解法是“次二次方稀疏注意力”——不是每个token都去关注所有其他token,而是让模型学会挑重点。在百万token上下文下实现15.6倍解码加速,这个数字放在工程层面相当可观。

有意思的是,Hugging Face的研究员Adina Yakup评价说:“他们不只是在刷benchmark,在MoE效率和面向Agent的设计上做了很扎实的工作。”

这个判断点出了M3的核心目标——让超长上下文的AI Agent在经济上变得可行。

翻译成人话就是:以前跑不动,现在跑得起了。

商业化账本:你的AI订阅到底谁在买单?

但效率提升能不能转化为商业价值,还得看市场愿不愿意掏钱。

Simon Willison最近干了一件事:他把过去30天用Claude Code和OpenAI Codex消耗的token,按API价格折算了一遍。

结果吓了他一跳——$2,180 Worth的token,他只付了$200订阅费。整整差了10倍。

这说明什么?对个人重度用户来说,$100/月的订阅制简直是薅羊毛。

但企业客户就没这么幸运了。

Anthropic和OpenAI在最近几个月悄悄改了企业定价:从“套餐制”转向“基础费+API调用”。这意味着员工用得越多,公司付得越多,而且单价跟个人套餐完全不在一个量级。

The Information报道了这个转变,Anthropic据说去年11月就开始执行。企业客户正在发现一个残酷的事实:AI Agent烧起token来,比他们想象的要猛得多。

所以Anthropic即将迎来首个盈利季度,不是因为模型突然变得多厉害,而是因为他们终于找到了愿意为实际消耗买单的企业用户。

产品市场契合?也许。但更准确的描述可能是:企业终于意识到自己用AI用得有多狠了。

规模化落地的真相:没有银弹,只有泥泞

如果说上面的新闻还有点“科技前沿”的光鲜感,默克和万事达的案例就直接把镜头怼到了真实战场的泥地里。

默克的VP of Digital Platforms Sean Finnerty说了一句大实话:

"If we do one-offs, we're gonna end up with thousands and thousands of things that are ultimately just gonna be debt."

他们现在的成绩确实亮眼:AI辅助把药物发现周期缩短了33%,营销材料交付提速80%,合规审核从几个月压到几天。但Finnerty反复强调的只有一件事:先把基础设施修好。

默克现在的数据管道支持2,500个AWS账户、多个Azure订阅、新增的GCP集成、47个边缘节点、数百个数据库。这才叫真正的“Agentic AIready”。

不是买个模型API,然后期待它自己搞定一切。

你的数据在哪?Agent能访问到吗?权限怎么管?输出怎么验证?上下文怎么及时交付? 这些问题不会因为你用了最新一代模型就自动消失。

万事达也是类似的路子。两家公司都在说同一句话:底层的“管道”不过关,应用层的“智能”就是空中楼阁。

RSI的诱惑与陷阱:AI能自己改进自己吗?

当然,行业里永远不会缺席的概念是RSI——递归自我改进。

Richard Socher刚拿了3亿美元创立Recursive Superintelligence,目标是让AI系统完全自动完成“想法→实现→验证”的研究闭环。Karpathy则在GitHub上推进Auto-Research项目,用Agent swarm训练LLM处理简单任务。

愿景很宏大。但现实呢?

Karpathy自己今年3月发推说过:“这不是什么novel, groundbreaking research (yet)。”他的工作目前还局限在GPT-2规模模型上做微小改进。

问题在于,RSI面临一个根本性的悖论:如果AI改进AI的能力还不成熟,为什么相信它能持续改进自己?

这不是唱衰。技术路径可能走得通,工程难题也可能被攻克。但在这个时间点,RSI更像是给投资人讲的故事,而不是可以落地的产品路线图。

向量空间里的隐喻:可控性与智能的关系

有意思的是,Epicure食材嵌入模型的研究提供了一个略显冷门但很有启发的视角。

他们把410万份食谱、7种语言的人类烹饪知识压缩进了一个300维的向量空间。通过SLERP球面线性插值,可以实现“方向算术”——比如在向量空间里导航,找出某种食材的替代品,或者探索某种菜系的演变规律。

这个研究的技术贡献是方法论层面的,但它隐含了一个更深的思考:当我们把所有知识压缩进向量空间,智能到底变得更可控了,还是更不可解释了?

Epicure的答案是:如果你控制了训练数据的结构和嵌入的维度,你就能在向量空间里进行可控导航。智能不是黑箱,而是一张可以解释和操控的几何结构。

这跟MiniMax的稀疏注意力、默克的管道建设,其实说的是同一件事:想把AI用好,你得理解它的底层结构,而不是只盯着表层输出。

拼图开始清晰了

回过头来看这五篇文章,它们的内在联系正在浮现:

MiniMax在解决推理效率问题,Anthropic在验证商业化可行性,默克和万事达在证明规模化落地需要基础设施先行,Epicure在探索如何让智能变得可控,而RSI则代表了另一个方向——技术理想主义者的终极想象。

把它们拼在一起,核心论点变得清晰了:

2026年AI的新战场,不是模型参数的军备竞赛,而是效率、成本与系统可靠性的综合比拼。谁能把“管道”修好,谁才能真正把AI变成生产力。

技术狂飙会继续,AGI/RSI的故事会继续讲下去。但对于真正在干活的企业来说,明天能不能交付一个合规的营销材料、下个季度能不能把药物发现周期再压缩10%,这些问题远比“RSI何时到来”更紧迫。

所以,2026年最值得押注的,可能不是下一个GPT-5或RSI实现,而是那些默默修管道的人。


【锐评】:技术圈永远在追逐“更聪明的AI”,但真正能让AI落地的,永远是那些愿意埋头修管道的“笨蛋”。RSI可以讲给投资人听,管道修得烂只能自己扛。


参考来源

  1. MiniMax预告M3模型:全新稀疏注意力机制带来15.6倍长上下文推理加速
  2. Anthropic与OpenAI已找到产品市场契合点?从API定价看AI商业化真实账本
  3. RSI接棒AGI:AI自我进化是技术突破还是新一轮炒作?
  4. 将人类烹饪知识压缩进向量空间:Epicure食材嵌入模型的几何导航实践
  5. 默克与万事达的Agentic AI实战:底层"管道"基建才是规模化落地的关键