模型军备2.0：当AI公司开始「造楼」和「种田」

封面图

2026年的AI竞赛，正在发生一场深刻分野。

一边是OpenAI刚刚用大模型推翻了一个困扰数学家80年的猜想，而Anthropic正每月掏出12.5亿美元购买xAI的算力；另一边，Cohere把一个2180亿参数的模型开源了，阿里则在35小时里让AI自主执行了1000次工具调用。

这几件事看似风马牛不相及，但放在一起看，一个新的叙事正在浮现——

AI公司正在从「炼丹」走向「造楼」。模型能力依然是基础，但真正决定胜负的，是基础设施、开放生态，以及——能不能搞真正的科研。

一、算力：从「买显卡」到「买楼」

先说最直观的一个信号：算力采购规模已经进入了「百亿美元俱乐部」。

Anthropic与xAI的协议曝光了：每月12.5亿美元，包到2029年。这意味着Anthropic三年内要给xAI掏400亿美元。

400亿美元是什么概念？

这相当于一个中型城市一年的GDP，或者——可以建好几个数据中心了。

有意思的是这背后的商业逻辑。xAI一边卖Grok，一边把自己的算力「租」给了最大的竞争对手Anthropic。这操作很马斯克：基础设施建的太大，自家用不完，那就打包卖给友商。

"xAI appears to have overbuilt its compute capacity and needed to find a way to monetize it ahead of a public offering."

翻译成人话就是：GPU建太多了，GPU不能闲着，得想办法变现。

而Anthropic为什么要买？

答案很简单：自建太贵，自建太慢。直接租成熟的算力，在GPU紧张的市场里反而是最经济的选择。

这不是简单的买卖关系，这是一个新兴的「算力二级市场」。 企业级AI的基础设施游戏，正在从「买显卡」升级为「买楼」——而且是长期租约。

二、硬件：晶圆级芯片的「逆袭」

如果说算力采购是「买楼」，那Cerebras就是在秀自己的「盖楼能力」。

这家做晶圆级芯片的公司刚刚交出了一份让GPU云「没脸看」的答卷：

在万亿参数MoE模型的推理上，Cerebras跑出了981 tokens/秒的吞吐量——比最快的GPU云快了6.7倍，是中位数的23倍。

做个对比更直观：处理一个标准的Agent代码请求，GPU云要163.7秒，Cerebras只要5.6秒。

29倍的差距。

长期以来，晶圆级芯片被看作「技术奇观但不实用」——速度快是快，但只能跑小模型。这次Cerebras跑通了Kimi K2.6，一个万亿参数的大模型，正式宣告晶圆级芯片「能打大仗」了。

而且别忘了，这家公司刚完成了2026年最大的科技IPO，估值950亿美元，手里握着55亿美元现金。

弹药充足，枪也够快。GPU云的护城河，正在被撕开一道口子。

三、开源：Apache 2.0的「圈地运动」

算力、芯片、模型——基础设施的每个环节都在争夺。但在开源领域，一场「圈地运动」也在悄然展开。

Cohere发布了Command A+，第一个采用Apache 2.0协议的开源大模型。

为什么重要？因为Apache 2.0是目前最宽松的开源许可证之一——你可以商用，可以修改，可以闭源发布衍生作品，不要求开源你的代码。

这意味着什么？

企业终于可以「放心用」了。

不用再担心OpenAI哪天改协议，不用再担心开源模型有法律风险。Cohere直接把2180亿参数的模型权重公开，免费商用，企业可以跑在自己的服务器上，完全自主可控。

这就是「主权AI」（Sovereign AI）的核心叙事：我的数据、我的模型、我的算力——全部在自己的楼里。

有趣的是Cohere的稀疏MoE架构：总共2180亿参数，但只激活250亿。这种「多专多能」的设计让模型在企业级部署上极具性价比——既跑得快，又省资源。

开源，正在从「技术选择」变成「商业战略」。

四、科研：AI不再只会「答题」

如果说基础设施是「造楼」，那OpenAI推翻80年几何猜想这件事，就是在证明——

AI不只会盖楼和装修，它还能搞「基础研究」。

Erdős在1946年提出的「平面单位距离问题」，过去80年里难倒了无数数学家。而OpenAI的大模型不仅理解了这个问题，还构造出了反例，推翻了一个长期存在的猜想。

关键在于，这不是针对数学领域单独训练的模型，也不是专门针对这个猜想的「定向爆破」。它是用一个通用的推理模型，在没有特定提示的情况下，自己「想出来」的。

这意味着什么？

AI的推理能力，正在从「模式匹配」走向「真正的数学发现」。数学家Noga Alon说这是「Erdős最喜爱的问题之一」，现在，AI也参与进来了。

科研能力，正在成为评估AI公司「深度」的新标尺。 过去比谁答对的多，现在比谁能做出新东西。

五、Agent：从「对话」到「长跑」

最后说说阿里Qwen3.7-Max这件事。

35小时，1000次工具调用，AI全程自主执行，中途不崩溃，输出稳定，幻觉率低。

这是真正意义上的「长程Agent」。

过去大家讨论Agent，都是「我能帮你订酒店、订机票」。但Qwen3.7展示的是：AI可以在35个小时里自主优化一个内核，执行1000多步操作，最终交付一个可用的成果。

这不是「对话」级别的任务，是「项目」级别的任务。

而且Qwen3.7还强调了一个点：跨框架泛化能力。不管是Claude Code、OpenClaw还是Qwen Code，模型表现一致稳定。这意味着什么？

企业在部署Agent时，不再需要绑死在某个特定的开发框架上。模型本身就是「底座」，框架可以换，能力不打折。

Agent正在从「工具」变成「同事」。 能独立完成一个多步骤的长期任务，是AI从「玩具」变成「生产力」的标志。

结语

回到开头那个问题：这几件事放在一起，说明了什么？

AI竞赛正在从「模型能力单点突破」，演变为「基础设施、开放生态、科研能力」的三位一体竞争。

基础设施决定了你能不能跑得动、跑得起
开放生态决定了你能不能被信任、被广泛采用
科研能力决定了你能不能不只是「应用」，而是能「创造」

「造楼」和「种田」，是两种不同的策略。

有的公司在盖高楼，建数据中心，囤算力；有的公司在种田，发开源模型，做Agent生态。

但最终，会活下来的是那些既能造楼、也能种田、还能在实验室里搞出点新东西的玩家。

2026年的AI竞赛，裁判不是用户，是时间。

【锐评】：算力协议400亿、晶圆级芯片6.7倍速、开源Apache 2.0、AI搞科研——这几件事加在一起，说白了就是AI行业的「战国时代」。大家都在抢地盘的阶段，有人造楼，有人种田，有人搞科研秀肌肉。但别忘了，真正能活下来的，不是最大的那个，而是最适应变化的。

参考来源：

OpenAI: "An OpenAI model has disproved a central conjecture in discrete geometry" - https://openai.com/index/model-disproves-discrete-geometry-conjecture/
VentureBeat: "Cohere cracks lossless quantization and native citations with first full Apache 2.0 licensed open model Command A+" - https://venturebeat.com/technology/cohere-cracks-lossless-quantization-and-native-citations-with-first-full-apache-2-0-licensed-open-model-command-a
VentureBeat: "Cerebras says its chips run a trillion-parameter AI model nearly 7 times faster than GPU clouds" - https://venturebeat.com/technology/cerebras-says-its-chips-run-a-trillion-parameter-ai-model-nearly-7-times-faster-than-gpu-clouds
Qwen Blog: "Qwen3.7-Max: The Agent Frontier" - https://qwen.ai/blog?id=qwen3.7
TechCrunch: "Anthropic will pay xAI $1.25 billion per month for compute" - https://techcrunch.com/2026/05/20/anthropic-will-pay-xai-1-25-billion-per-month-for-compute/