DeepSeek 周五放出下一代开源模型 V4 预览版。公司称,V4 可与 OpenAI、Anthropic、Google 的领先闭源模型竞争,并强调代码能力比前代更强。
这次发布的重点,不是“又一个大模型来了”。重点是三条线被绑到了一起:开源模型、代码 agent、国产算力兼容。它们共同指向一个问题:美国闭源巨头的护城河,到底是技术领先,还是成本结构暂时没被打穿?
V4 现在仍是预览版。训练成本、训练所用硬件、第三方评测都还没公开。DeepSeek 的说法可以记录,但不能直接替它盖章。
V4 发布了什么:代码能力被放到台前
DeepSeek 给 V4 的定位很清楚:下一代开源模型预览版,目标是对标美国领先闭源系统。它特别强调代码能力提升。
这不是随便挑的宣传点。代码能力已经成了 AI agent 的硬入口。OpenAI 有 ChatGPT Codex,Anthropic 有 Claude Code,开发者愿意为省时间付费,企业也更容易把“写代码、改代码、查 bug”算成 ROI。
| 变量 | DeepSeek 已经说了什么 | 对读者意味着什么 | 还缺什么证据 |
|---|---|---|---|
| 模型定位 | V4 是下一代开源模型预览版 | 开源阵营继续逼近闭源前沿 | 正式版时间、许可细节、完整能力边界 |
| 竞争对象 | 称可与 OpenAI、Anthropic、Google 闭源领先模型竞争 | 闭源模型的价格和能力叙事会被拿来重新比较 | 第三方基准、真实任务表现 |
| 代码能力 | 称相比前代有明显提升 | 直接进入 coding agent 和开发者工具竞争 | 长项目、复杂仓库、团队协作场景验证 |
| 华为兼容 | 明确强调兼容华为技术 | 给国产芯片路线增加应用锚点 | 不等于完全摆脱 Nvidia,也不等于训练主力已切换 |
| 成本与硬件 | 尚未披露训练成本和训练硬件 | 外界无法复盘效率故事 | 这是最大空白 |
对关注 AI 模型竞争和开源生态的读者,最现实的动作不是立刻站队。是等三类结果:代码评测、开源许可、真实 agent 案例。
如果 V4 只能在短题、样例题里好看,它只是发布会模型。如果它能在复杂代码库里稳定改 bug、补测试、读上下文,才会动到 Codex 和 Claude Code 的生意。
关键变量不是跑分,是成本和硬件
一年前,DeepSeek R1 震动美国 AI 行业,靠的是低成本叙事。它声称用远低于美国领先模型的训练成本,做出了足够强的推理模型。
那次真正刺到美国同行的地方,不是某个单项能力。是它碰到了美国 AI 叙事的底盘:更多 GPU、更多资金、更大集群,是否必然换来不可追赶的领先?
V4 延续了这条线,也留下同一个洞。训练成本没披露。训练硬件也没披露。
这不是细节。大模型竞争已经是“粮草战争”。《孙子兵法》说“兵马未动,粮草先行”。今天的粮草,就是 GPU、互联、能耗、工程优化和人才密度。模型能力是前线战报,训练成本才是后勤账本。
DeepSeek 还背着争议。美国官员曾指控它使用受限 Nvidia 芯片。Anthropic 也声称 DeepSeek 曾借 Claude 改进自家产品。这些说法目前不能写成定论,但会影响外界理解 V4 的方式。
如果效率来自工程突破,那是产业变量。如果效率部分依赖争议硬件或蒸馏路径,那就是另一套故事。两者对行业的含义完全不同。
华为兼容也要拆开看。它可以被视为中国芯片产业的一个里程碑,因为一家头部大模型公司愿意公开强调适配国产技术,本身就说明国产算力正在争取从“可展示”走向“可部署”。
但兼容不是替代。适配不是训练主力。没看到训练硬件之前,把 V4 写成“摆脱 Nvidia”,就是替叙事加戏。
对关心中美算力供应链和国产芯片叙事的产业观察者,动作也很具体:别只看口号,看部署链条。V4 能不能在华为技术上稳定推理、规模部署、控制成本,比“兼容”两个字重要得多。
DeepSeek 真正逼对手重算账本
OpenAI、Anthropic、Google 的优势还在。它们有更成熟的产品入口、企业合规、工具链、云基础设施和全球客户渠道。DeepSeek 现在没有证据证明 V4 已经全面压过它们。
但 DeepSeek 的杀伤力不一定来自“全面胜利”。它只要让企业多一个可选项,闭源模型的定价权就会变薄。
企业 CTO 不会只问“谁最强”。他们还会问三件事:够不够用、能不能控、贵不贵。
如果一个开源模型能承担 70% 的代码任务,并支持更可控的部署,闭源 API 就要解释剩下 30% 为什么值得高价。这个解释会越来越难。
开发者的动作会更快。预算敏感的小团队,会先把 V4 放进工具链试跑:补测试、修小 bug、读代码、生成脚本。好用就留一部分工作流,不好用就退回 Codex 或 Claude Code。
企业客户会慢一点。它们更可能延后采购,等待正式版、评测和部署案例。尤其是涉及本地化部署、数据安全、国产硬件路线的团队,不会只看模型口号。
历史上,Linux 没有靠一次发布杀死 Windows。但它改写了服务器、云和基础设施的成本结构。今天的开源大模型也未必马上击穿 OpenAI 或 Anthropic,却可能先松动一个共识:高质量模型能力必须高价购买。
“天下熙熙,皆为利来。”AI 行业也一样。谁能把单位智能成本压下来,谁就能逼对手改报价、改产品、改叙事。
接下来只看四件事:第三方代码评测、真实 agent 项目表现、训练硬件披露、华为兼容在推理和部署中的稳定性。少一个,V4 都只是强势预告;补齐了,才算真正上桌。
