封面图

2026年的AI竞赛,正在发生一场深刻分野。

一边是OpenAI刚刚用大模型推翻了一个困扰数学家80年的猜想,而Anthropic正每月掏出12.5亿美元购买xAI的算力;另一边,Cohere把一个2180亿参数的模型开源了,阿里则在35小时里让AI自主执行了1000次工具调用。

这几件事看似风马牛不相及,但放在一起看,一个新的叙事正在浮现——

AI公司正在从「炼丹」走向「造楼」。模型能力依然是基础,但真正决定胜负的,是基础设施、开放生态,以及——能不能搞真正的科研。


一、算力:从「买显卡」到「买楼」

先说最直观的一个信号:算力采购规模已经进入了「百亿美元俱乐部」。

Anthropic与xAI的协议曝光了:每月12.5亿美元,包到2029年。这意味着Anthropic三年内要给xAI掏400亿美元。

400亿美元是什么概念?

这相当于一个中型城市一年的GDP,或者——可以建好几个数据中心了。

有意思的是这背后的商业逻辑。xAI一边卖Grok,一边把自己的算力「租」给了最大的竞争对手Anthropic。这操作很马斯克:基础设施建的太大,自家用不完,那就打包卖给友商。

"xAI appears to have overbuilt its compute capacity and needed to find a way to monetize it ahead of a public offering."

翻译成人话就是:GPU建太多了,GPU不能闲着,得想办法变现。

而Anthropic为什么要买?

答案很简单:自建太贵,自建太慢。直接租成熟的算力,在GPU紧张的市场里反而是最经济的选择。

这不是简单的买卖关系,这是一个新兴的「算力二级市场」。 企业级AI的基础设施游戏,正在从「买显卡」升级为「买楼」——而且是长期租约。


二、硬件:晶圆级芯片的「逆袭」

如果说算力采购是「买楼」,那Cerebras就是在秀自己的「盖楼能力」。

这家做晶圆级芯片的公司刚刚交出了一份让GPU云「没脸看」的答卷:

在万亿参数MoE模型的推理上,Cerebras跑出了981 tokens/秒的吞吐量——比最快的GPU云快了6.7倍,是中位数的23倍。

做个对比更直观:处理一个标准的Agent代码请求,GPU云要163.7秒,Cerebras只要5.6秒。

29倍的差距。

长期以来,晶圆级芯片被看作「技术奇观但不实用」——速度快是快,但只能跑小模型。这次Cerebras跑通了Kimi K2.6,一个万亿参数的大模型,正式宣告晶圆级芯片「能打大仗」了。

而且别忘了,这家公司刚完成了2026年最大的科技IPO,估值950亿美元,手里握着55亿美元现金。

弹药充足,枪也够快。GPU云的护城河,正在被撕开一道口子。


三、开源:Apache 2.0的「圈地运动」

算力、芯片、模型——基础设施的每个环节都在争夺。但在开源领域,一场「圈地运动」也在悄然展开。

Cohere发布了Command A+,第一个采用Apache 2.0协议的开源大模型。

为什么重要?因为Apache 2.0是目前最宽松的开源许可证之一——你可以商用,可以修改,可以闭源发布衍生作品,不要求开源你的代码。

这意味着什么?

企业终于可以「放心用」了。

不用再担心OpenAI哪天改协议,不用再担心开源模型有法律风险。Cohere直接把2180亿参数的模型权重公开,免费商用,企业可以跑在自己的服务器上,完全自主可控。

这就是「主权AI」(Sovereign AI)的核心叙事:我的数据、我的模型、我的算力——全部在自己的楼里。

有趣的是Cohere的稀疏MoE架构:总共2180亿参数,但只激活250亿。这种「多专多能」的设计让模型在企业级部署上极具性价比——既跑得快,又省资源。

开源,正在从「技术选择」变成「商业战略」。


四、科研:AI不再只会「答题」

如果说基础设施是「造楼」,那OpenAI推翻80年几何猜想这件事,就是在证明——

AI不只会盖楼和装修,它还能搞「基础研究」。

Erdős在1946年提出的「平面单位距离问题」,过去80年里难倒了无数数学家。而OpenAI的大模型不仅理解了这个问题,还构造出了反例,推翻了一个长期存在的猜想。

关键在于,这不是针对数学领域单独训练的模型,也不是专门针对这个猜想的「定向爆破」。它是用一个通用的推理模型,在没有特定提示的情况下,自己「想出来」的。

这意味着什么?

AI的推理能力,正在从「模式匹配」走向「真正的数学发现」。数学家Noga Alon说这是「Erdős最喜爱的问题之一」,现在,AI也参与进来了。

科研能力,正在成为评估AI公司「深度」的新标尺。 过去比谁答对的多,现在比谁能做出新东西。


五、Agent:从「对话」到「长跑」

最后说说阿里Qwen3.7-Max这件事。

35小时,1000次工具调用,AI全程自主执行,中途不崩溃,输出稳定,幻觉率低。

这是真正意义上的「长程Agent」。

过去大家讨论Agent,都是「我能帮你订酒店、订机票」。但Qwen3.7展示的是:AI可以在35个小时里自主优化一个内核,执行1000多步操作,最终交付一个可用的成果。

这不是「对话」级别的任务,是「项目」级别的任务。

而且Qwen3.7还强调了一个点:跨框架泛化能力。不管是Claude Code、OpenClaw还是Qwen Code,模型表现一致稳定。这意味着什么?

企业在部署Agent时,不再需要绑死在某个特定的开发框架上。模型本身就是「底座」,框架可以换,能力不打折。

Agent正在从「工具」变成「同事」。 能独立完成一个多步骤的长期任务,是AI从「玩具」变成「生产力」的标志。


结语

回到开头那个问题:这几件事放在一起,说明了什么?

AI竞赛正在从「模型能力单点突破」,演变为「基础设施、开放生态、科研能力」的三位一体竞争。

  • 基础设施决定了你能不能跑得动、跑得起
  • 开放生态决定了你能不能被信任、被广泛采用
  • 科研能力决定了你能不能不只是「应用」,而是能「创造」

「造楼」和「种田」,是两种不同的策略。

有的公司在盖高楼,建数据中心,囤算力;有的公司在种田,发开源模型,做Agent生态。

但最终,会活下来的是那些既能造楼、也能种田、还能在实验室里搞出点新东西的玩家。

2026年的AI竞赛,裁判不是用户,是时间。


【锐评】:算力协议400亿、晶圆级芯片6.7倍速、开源Apache 2.0、AI搞科研——这几件事加在一起,说白了就是AI行业的「战国时代」。大家都在抢地盘的阶段,有人造楼,有人种田,有人搞科研秀肌肉。但别忘了,真正能活下来的,不是最大的那个,而是最适应变化的。


参考来源:

  • OpenAI: "An OpenAI model has disproved a central conjecture in discrete geometry" - https://openai.com/index/model-disproves-discrete-geometry-conjecture/
  • VentureBeat: "Cohere cracks lossless quantization and native citations with first full Apache 2.0 licensed open model Command A+" - https://venturebeat.com/technology/cohere-cracks-lossless-quantization-and-native-citations-with-first-full-apache-2-0-licensed-open-model-command-a
  • VentureBeat: "Cerebras says its chips run a trillion-parameter AI model nearly 7 times faster than GPU clouds" - https://venturebeat.com/technology/cerebras-says-its-chips-run-a-trillion-parameter-ai-model-nearly-7-times-faster-than-gpu-clouds
  • Qwen Blog: "Qwen3.7-Max: The Agent Frontier" - https://qwen.ai/blog?id=qwen3.7
  • TechCrunch: "Anthropic will pay xAI $1.25 billion per month for compute" - https://techcrunch.com/2026/05/20/anthropic-will-pay-xai-1-25-billion-per-month-for-compute/