DeepSeek 放出了 V4 系列两个预览模型:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。两者都是 1M token 上下文的 MoE 模型,采用 MIT 许可开放权重。Pro 总参数 1.6T、激活 49B,模型文件约 865GB;Flash 总参数 284B、激活 13B,约 160GB。
这次最该盯的不是“DeepSeek 又追到前沿了吗”。DeepSeek 自己在论文里也承认,Pro-Max 仍落后 GPT-5.4、Gemini 3.1 Pro 约 3 到 6 个月。真正刺眼的是价格:Flash 输入 $0.14/M、输出 $0.28/M;Pro 输入 $1.74/M、输出 $3.48/M。闭源前沿模型的价格锚,被敲了一下硬的。
V4 Pro 可能成了最大开源权重模型,但别把它叫成完整开源胜利
按公开规格看,V4 Pro 的 1.6T 总参数超过 Kimi K2.6 的 1.1T、GLM-5.1 的 754B,也超过 DeepSeek V3.2 的 685B 两倍以上。若只看“开放权重模型”这个口径,它很可能已经站到规模第一梯队。
| 模型 | 总参数 / 激活参数 | 上下文 | 权重与体积 |
|---|---|---|---|
| DeepSeek V4 Pro | 1.6T / 49B | 1M token | MIT,约 865GB |
| DeepSeek V4 Flash | 284B / 13B | 1M token | MIT,约 160GB |
| DeepSeek V3.2 | 685B / 未列明 | — | 上一代参照 |
但话要说清。MIT 许可开放权重,不等于训练数据、训练代码、完整训练流程都开放。开发者能下载、能部署、能改权重使用方式,这是实打实的价值;但学界若想复现实验、审计数据来源、追踪训练配方,仍然缺关键拼图。
Flash 量化后也许会进入高内存个人设备的试验区,比如 128GB 级别的 MacBook Pro。Pro 就别急着幻想“本地随便跑”。865GB 的体积、MoE 专家调度、磁盘流式加载,都不是普通开发者一句命令能解决的事。
低价不是只靠补贴,效率才是这次的刀口
DeepSeek 给出的解释很具体:长上下文场景下,它们把计算和 KV cache 压了下来。论文自述,在 1M token 场景中,V4 Pro 的单 token FLOPs 只有 V3.2 的 27%,KV cache 只有 10%;V4 Flash 更低,分别是 10% 和 7%。这不是营销话术里的“便宜”,而是推理账单里最硬的变量。
| 模型 | 输入价格 | 输出价格 | 对标位置 |
|---|---|---|---|
| V4 Flash | $0.14/M | $0.28/M | 低于 GPT-5.4 Nano、Gemini Flash-Lite 等小模型价位 |
| V4 Pro | $1.74/M | $3.48/M | 低于 GPT-5.4、Gemini 3.1 Pro、Claude Sonnet/Opus 多数同档模型 |
这对 AI 产品团队很现实。以前做长文档问答、代码库分析、客服知识库,预算经常死在两个地方:上下文太长,输出太贵。现在如果 V4 的稳定性、延迟和工具调用能力能跟上,一些团队会重新算账:原来只能给高级用户用的功能,可能下放到普通套餐;原来要裁剪上下文的流程,可能直接塞全量资料。
“天下熙熙,皆为利来。”这句放在大模型 API 市场不俗。模型能力当然重要,但采购会最终看的不是排行榜截图,而是每月账单、SLA、合规边界和迁移成本。DeepSeek 这次打的不是炫技牌,是财务部门听得懂的牌。
闭源厂商真正难受的是价格叙事失灵
OpenAI、Google、Anthropic 仍然握着强模型、产品生态、企业合规和开发者工具链。DeepSeek 还没有证明 V4 在真实业务里能稳定替代这些闭源模型。论文里的 benchmark 也只是 DeepSeek 自报,不能当第三方裁判结果。
可麻烦在于,价格锚一旦被打穿,客户心理会变。过去企业接受高价,是因为“前沿模型就该这么贵”。现在同一张采购表上出现一个更便宜、权重可拿、长上下文成本更低的选项,闭源厂商就必须解释:你贵出的那几倍,到底买到了什么?更强推理?更低幻觉?更好工具链?还是更稳的企业支持?
铁路、电力、云计算都走过类似路径。早期比的是谁能造出来,后来比的是谁能把单位成本压到足够低。AI 模型也在进入这个阶段。不完全一样,因为模型质量仍有断层,合规和安全也会挡住一部分迁移。但方向很清楚:前沿能力若不能转化成可承受价格,就会变成少数客户的奢侈品。
接下来最该看三件事:第三方评测是否确认 DeepSeek 的性能区间;Flash 量化版能否在本地和私有化场景跑得顺;Pro 的 API 延迟、稳定性和长上下文真实成本是否经得住生产环境。跑分只是门票,账单才是长期合同。
