又一颗"深水炸弹"
484天。
这是从DeepSeek-V3发布到V4亮相的时间跨度。
但市场等待的煎熬感,远不止484天。
2025年1月那场"DeepSeek时刻"之后,全世界都在盯着这家中国量化基金旗下的AI公司——你还会带来什么?
答案在昨夜揭晓:DeepSeek-V4。
1.6万亿参数的混合专家模型(MoE),MIT开源协议,性能逼近全球最顶尖的闭源系统。
价格呢?
GPT-5.5和Claude Opus 4.7的七分之一。
不是六折、七折,是脚踝斩。
一个行业共识正在被击碎:搞AI,必须烧钱如烧纸。
价格表上的"屠杀"
来看这张杀伤力惊人的对比表:
| 模型 | 输入+输出成本(每百万token) |
|---|---|
| GPT-5.5 | $35.00 |
| Claude Opus 4.7 | $30.00 |
| DeepSeek-V4-Pro | $5.22 |
| DeepSeek-V4-Flash | $0.42 |
$5.22 vs $35。
差了整整一个数量级。
更狠的是Flash版本,$0.42——不到GPT-5.5的2%。
这已经不是性价比问题了,这是"你还好意思收这么多钱"的问题。
DeepSeek-V4-Pro的定价策略极其鸡贼:它不是来搞价格战的,它是来把高端AI的定价逻辑整个掀翻的。
什么意思?
以前企业用GPT-5.5做自动化决策,算账的时候得反复掂量——这笔开销值不值?
现在,同样的任务,成本直接砍到七分之一。
很多原本"太贵不值得"的应用场景,突然就具备了商业可行性。
闭源厂商们引以为傲的"性能溢价",正在被一层层剥掉。
技术上它凭什么这么便宜?
便宜没好货?
在AI领域,这句话正在失效。
DeepSeek-V4的低价背后,是一套极其激进的技术创新组合拳。
首先是原生100万token上下文窗口。
传统做法是暴力堆内存,DeepSeek换了个思路: Hybrid Attention Architecture(混合注意力架构)。
简单说,它用压缩稀疏注意力(CSA)降低初始token维度,再用重度压缩注意力(HCA)压显存占用。
结果:处理100万token上下文,KV缓存只需要V3的10%,单token推理算力只有V3的27%。
这是什么意思?
别人要修10车道高速公路才能跑大货车;DeepSeek修了条智能高速,10%的维护成本,跑得一样快。
其次是mHC(流形约束超连接)。
1.6万亿参数的模型,训练极容易"炸掉"。
DeepSeek的解决方案是给整个网络装了个"AI交通控制器"。
信息可以更宽、更复杂地流动,但模型不会因此不稳定。
官方比喻很形象:相当于给城市修了10车道高速公路,还配了套完美的AI红绿灯系统,永远不堵车。
最后是Muon优化器。
让模型在32万亿高质量token的预训练中,更快收敛、更稳训练。
再加上Mixture-of-Experts(MoE)设计——虽然总参数1.6万亿,但每个token只激活其中的49B。
相当于买了一栋楼的CPU,但只用其中的几间办公室。
省钱,是真的在技术上省出来的。
真正的大杀器:不用Nvidia了
技术强只是表层。
真正让华盛顿那帮人睡不着觉的,是另一件事:
DeepSeek在华为Ascend NPU上跑通了,而且加速效果是1.5倍到1.73倍。
注意,官方说V4训练用的是"合法授权的Nvidia GPU",但他们同样验证了在华为NPU上的专家并行方案。
这意味着什么?
全球AI训练被Nvidia GPU卡脖子的现状,出现了一个巨大的裂缝。
美国商务部的出口管制,本意是锁死中国获取高端算力的通道。
结果呢?
中国人不仅自己搞出了替代方案,还把效率优化到了接近Nvidia的水平。
分析师Rui Ma说,DeepSeek技术报告里最关键的一句话,恰恰是这一句关于华为NPU的描述。
因为这交出了一份完整的"脱离Nvidia路线图"。
主权AI这四个字,以前是口号,现在开始有实打实的工程样本了。
性能到底怎么样?
该泼点冷水了。
价格是真香,但性能并没有"吊打"GPT-5.5和Claude Opus 4.7。
DeepSeek-V4-Pro-Max在官方对比中表现最好的是BrowseComp(网页浏览代理任务),83.4%,仅次于GPT-5.5的84.4%。
但在更核心的学术推理benchmark上:
- GPQA Diamond:DeepSeek 90.1% vs Claude Opus 4.7 94.2%
- Humanity's Last Exam(无工具):DeepSeek 37.7% vs Claude Opus 4.7 46.9%
差距依然存在。
Terminal-Bench 2.0上,DeepSeek 67.9%,Claude Opus 4.7 69.4%,GPT-5.5 82.7%。
SWE-Bench Pro(软件工程能力):DeepSeek 55.4%,Claude Opus 4.7 64.3%。
所以结论是:DeepSeek-V4-Pro-Max是目前最强的开源权重模型,在很多任务上接近甚至追平闭源顶级模型,但并没有在所有维度上实现碾压。
它更像是闭源系统的一个"高性价比平替",而非"全面超越"。
但这就够了。
因为在企业级应用场景里,性能差距在可接受范围内,成本却只有七分之一——这道算术题,答案太明显了。
开源本身就是一种武器
MIT License。
这是DeepSeek扔出的另一颗核弹。
最 permissive 的开源协议,没有商业授权费,没有使用限制,没有分成要求。
对比隔壁Anthropic和OpenAI的"restricted"开源权重授权,高下立判。
DeepSeek的核心理念就一句话:"AGI属于所有人。"
这话听起来像口号,但V4的发布让它有了实质意义。
一个初创公司可以用它做产品,一个学术团队可以用它做研究,一个发展中国家可以用它搭建自己的AI基础设施。
不用看OpenAI脸色,不用给Anthropic交租子。
开源不只是技术选择,更是地缘政治选择。
行业震荡刚刚开始
社区反应就两个字:炸了。
Hugging Face官方发文:百万token上下文时代的成本痛点,被DeepSeek一次性解决。
AI评估机构Vals AI说:DeepSeek-V4现在是我们Vibe Code Benchmark的第一名,而且"差距很大"。
最意味深长的是这句:DeepSeek宣布将在2026年7月24日彻底关停deepseek-chat和deepseek-reasoner旧接口,所有流量迁移到V4-Flash。
这是什么意思?
ALL IN V4。
不搞版本并行,不给旧模型留活路。
对自己够狠,对行业够卷。
【锐评】:
DeepSeek这波操作,本质上是在AI领域打了一场"不对称战争"——我用开源和成本优势,撬动你闭源和品牌溢价的墙角。性能追到90分,价格降到1/7,这场账任何企业都会算。真正的悬念是:当开源能追平闭源90%的能力,"闭源更安全/更先进"的叙事还剩多少说服力?
参考链接:
https://venturebeat.com/technology/deepseek-v4-arrives-with-near-state-of-the-art-intelligence-at-1-6th-the-cost-of-opus-4-7-gpt-5-5