当所有人以为大模型竞赛已经定局
一个成立不到两年的中国AI实验室,用不到行业十分之一的成本,做出了参数规模全球第一的开源模型。
就在昨天,DeepSeek扔下两颗重磅炸弹:V4 Flash和V4 Pro。
这不是普通的版本迭代。
V4 Pro版本,总参数1.6万亿,活跃参数490亿——比Moonshot AI的Kimi K2.6(1.1万亿)还大,比自家上一代V3.2(6710亿)翻了两倍多。
这是目前全球最大的开源模型。
而价格呢?每百万输入token只要0.145美元,每百万输出token3.48美元。对比一下GPT-5.5和Claude Opus 4.7的价格,几乎是拦腰斩。
说实话,这个定价策略摆明了不给活路。
参数怪兽是如何炼成的
DeepSeek这次用了一个叫"混合专家"(Mixture-of-Experts)的技术路线。
简单说就是:不干活的时候,模型大部分参数都在"摸鱼"。只有遇到特定任务,才激活其中一小部分参数参与计算。
V4 Pro总共有1.6万亿参数,但日常只动用490亿;V4 Flash更夸张,2840亿参数只激活130亿。
这就好比一家公司养了1.6万个员工,但每天只让490个人来上班,其他人远程待命。
成本自然就下来了。
官方说法是:新模型比V3.2"更高效、更强",推理能力"几乎追平"当前所有顶尖模型——包括开源的和闭源的。
DeepSeek还放了一张对比图,说V4-Pro-Max在推理benchmark上干翻了GPT-5.2和Gemini 3.0 Pro。编码能力呢?"可比肩GPT-5.4"。
性能接近GPT-5家族,价格只有人家的零头。
这要是真的,OpenAI和Anthropic的脸往哪儿搁?
但问题来了:它真的领先吗?
先别急着高潮。
DeepSeek自己写了一段很诚实的话:
"在知识测试上,我们还是比不过GPT-5.4和Gemini 3.1 Pro。差距大概是3到6个月。"
注意,这话是他们自己说的。
换句话说:推理任务我可能和你五五开,但比知识储备、比预训练的数据广度,我还是个弟弟。
另外还有个硬伤:V4系列目前只支持文本。
隔壁GPT-4o、Claude 3.5都能看图、听声、生成视频了,DeepSeek还只能读文字。
像是造出了全世界最快的打字机,但不会说话。
发布时机,太巧了
这篇新闻最魔幻的地方在于——
DeepSeek发布V4的前一天,美国政府刚刚指控中国通过"数千个代理账户"大规模窃取美国AI实验室的知识产权。
而DeepSeek自己,正被Anthropic和OpenAI公开指控"蒸馏"(distilling)他们的模型。
什么叫"蒸馏"?
说白了就是用OpenAI和Claude的输出来训练自己的模型,相当于考试的时候偷看学霸的答案,然后说自己也会做。
DeepSeek没正面回应过这些指控。
但他们用实际行动回击了:我的模型参数更大、价格更低、性能还追上了。
这是技术实力,还是"抄作业"抄出了水平?
真正的赢家是谁?
仔细想想这件事,很有意思。
DeepSeek用开源路线杀进来,参数规模做到世界第一,价格杀到行业地板价。你说他是搅局者也行,说是价格屠夫也行。
但开源这件事,从来不是做慈善。
当越来越多的开发者用上了DeepSeek的模型,形成了生态依赖——
下一步,是不是就该收网了?
OpenAI和Anthropic当年也是开源起家的,后来为什么都闭源了?
因为开源是战术,生态才是战略。
DeepSeek现在走的每一步,都像是两年前的OpenAI。
参数规模、价格战、开源生态——这三个关键词凑在一起,很难不让人多想。
尾声
最后说一个细节。
DeepSeek V4的上下文窗口做到了100万token。
这是什么概念?
相当于可以把整个代码库、整本小说、整年的财务报表一次性喂给模型。
以前这是闭源模型的专属特权,现在开源模型也做到了。
技术这东西,一旦有人打开潘多拉的魔盒,想再关上门就难了。
DeepSeek到底是那个打破垄断的"价格屠夫",还是这场AI竞赛里杀出来的一条"鲶鱼"?
可能两者都是。
【锐评】:参数规模和价格战从来不是终极答案,DeepSeek真正可怕的是逼着所有人重新思考——AI的护城河到底在哪里?
参考链接:
https://techcrunch.com/2026/04/24/deepseek-previews-new-ai-model-that-closes-the-gap-with-frontier-models/