参数王炸，价格腰斩：DeepSeek刚发布新模型，就被美国指控"偷技术"

当所有人以为大模型竞赛已经定局

一个成立不到两年的中国AI实验室，用不到行业十分之一的成本，做出了参数规模全球第一的开源模型。

就在昨天，DeepSeek扔下两颗重磅炸弹：V4 Flash和V4 Pro。

AI配图

这不是普通的版本迭代。

V4 Pro版本，总参数1.6万亿，活跃参数490亿——比Moonshot AI的Kimi K2.6（1.1万亿）还大，比自家上一代V3.2（6710亿）翻了两倍多。

这是目前全球最大的开源模型。

而价格呢？每百万输入token只要0.145美元，每百万输出token3.48美元。对比一下GPT-5.5和Claude Opus 4.7的价格，几乎是拦腰斩。

说实话，这个定价策略摆明了不给活路。

参数怪兽是如何炼成的

DeepSeek这次用了一个叫"混合专家"（Mixture-of-Experts）的技术路线。

简单说就是：不干活的时候，模型大部分参数都在"摸鱼"。只有遇到特定任务，才激活其中一小部分参数参与计算。

V4 Pro总共有1.6万亿参数，但日常只动用490亿；V4 Flash更夸张，2840亿参数只激活130亿。

这就好比一家公司养了1.6万个员工，但每天只让490个人来上班，其他人远程待命。

成本自然就下来了。

AI配图

官方说法是：新模型比V3.2"更高效、更强"，推理能力"几乎追平"当前所有顶尖模型——包括开源的和闭源的。

DeepSeek还放了一张对比图，说V4-Pro-Max在推理benchmark上干翻了GPT-5.2和Gemini 3.0 Pro。编码能力呢？"可比肩GPT-5.4"。

性能接近GPT-5家族，价格只有人家的零头。

这要是真的，OpenAI和Anthropic的脸往哪儿搁？

但问题来了：它真的领先吗？

先别急着高潮。

DeepSeek自己写了一段很诚实的话：

"在知识测试上，我们还是比不过GPT-5.4和Gemini 3.1 Pro。差距大概是3到6个月。"

注意，这话是他们自己说的。

换句话说：推理任务我可能和你五五开，但比知识储备、比预训练的数据广度，我还是个弟弟。

另外还有个硬伤：V4系列目前只支持文本。

隔壁GPT-4o、Claude 3.5都能看图、听声、生成视频了，DeepSeek还只能读文字。

像是造出了全世界最快的打字机，但不会说话。

发布时机，太巧了

这篇新闻最魔幻的地方在于——

AI配图

DeepSeek发布V4的前一天，美国政府刚刚指控中国通过"数千个代理账户"大规模窃取美国AI实验室的知识产权。

而DeepSeek自己，正被Anthropic和OpenAI公开指控"蒸馏"（distilling）他们的模型。

什么叫"蒸馏"？

说白了就是用OpenAI和Claude的输出来训练自己的模型，相当于考试的时候偷看学霸的答案，然后说自己也会做。

DeepSeek没正面回应过这些指控。

但他们用实际行动回击了：我的模型参数更大、价格更低、性能还追上了。

这是技术实力，还是"抄作业"抄出了水平？

真正的赢家是谁？

仔细想想这件事，很有意思。

DeepSeek用开源路线杀进来，参数规模做到世界第一，价格杀到行业地板价。你说他是搅局者也行，说是价格屠夫也行。

但开源这件事，从来不是做慈善。

当越来越多的开发者用上了DeepSeek的模型，形成了生态依赖——

下一步，是不是就该收网了？

OpenAI和Anthropic当年也是开源起家的，后来为什么都闭源了？

因为开源是战术，生态才是战略。

DeepSeek现在走的每一步，都像是两年前的OpenAI。

参数规模、价格战、开源生态——这三个关键词凑在一起，很难不让人多想。

尾声

最后说一个细节。

DeepSeek V4的上下文窗口做到了100万token。

这是什么概念？

相当于可以把整个代码库、整本小说、整年的财务报表一次性喂给模型。

以前这是闭源模型的专属特权，现在开源模型也做到了。

技术这东西，一旦有人打开潘多拉的魔盒，想再关上门就难了。

DeepSeek到底是那个打破垄断的"价格屠夫"，还是这场AI竞赛里杀出来的一条"鲶鱼"？

可能两者都是。

【锐评】：参数规模和价格战从来不是终极答案，DeepSeek真正可怕的是逼着所有人重新思考——AI的护城河到底在哪里？

参考链接：
https://techcrunch.com/2026/04/24/deepseek-previews-new-ai-model-that-closes-the-gap-with-frontier-models/