GLM-5.2 这次最扎眼的地方,不是又有一个模型刷榜。
更关键的是:一个 MIT 许可开放完整权重的中国大模型,753B 参数,1M token 上下文,纯文本输入,却在开放权重模型榜单里打到第一梯队,还在 WebDev 编码榜排到第二。
这对开发者和 AI 产品团队很现实。闭源头部模型还没被打穿,但价格、开放权重和工程能力这三把刀,已经砍到它们的利润区。
发生了什么:GLM-5.2 把开放权重模型推到前排
Z.ai 在 6 月 13 日先向 coding plan subscribers 提供 GLM-5.2。6 月 16 日,完整权重开放,采用 MIT license。
模型很大。753B 参数,权重约 1.51TB,MoE 架构,约 40B active parameters。
它不是多模态模型。GLM-5.2 只支持文本输入。Z.ai 另有视觉模型线,比如 GLM-5V-Turbo,但那不是这次开放权重的主角。
| 项目 | GLM-5.2 | 该怎么理解 |
|---|---|---|
| 开放方式 | 完整权重,MIT license | 商业使用和二次部署更友好 |
| 模型规模 | 753B 参数,约 1.51TB | 不是小团队随手能跑的模型 |
| 架构 | MoE,约 40B active parameters | 推理效率要靠工程系统兑现 |
| 输入形态 | 纯文本 | 不能误读成多模态突破 |
| 上下文 | 1M token | GLM-5.1 是 200K,长上下文明显加码 |
Artificial Analysis Intelligence Index v4.1 给 GLM-5.2 的分数是 51。它领先 MiniMax-M3、DeepSeek V4 Pro、Kimi K2.6。这个榜不是全部真理,但在独立评测里有参考价值。
Code Arena WebDev leaderboard 上,它排第二,仅次于 Claude Fable 5。这个结果反而更有信息量。
因为 GLM-5.2 没有图像输入。
它能在前端 Web 开发和 agentic coding 任务里冲到这个位置,至少说明一件事:前端编码能力不完全依赖“看图”。很多任务里,读懂需求、拆步骤、写结构化代码,比视觉输入更要命。
对做编码助手、内部研发平台、自动化前端生成的团队来说,这已经足够进入候选名单。不是直接替换闭源模型,而是必须纳入 POC。
便宜是真便宜,但低单价不等于低总成本
OpenRouter 上,GLM-5.2 来自 9 个供应商。多数报价约为每百万 input token 1.40 美元、output token 4.40 美元。
和闭源头部模型比,单价差距很大。
| 模型 | Input / 1M token | Output / 1M token |
|---|---|---|
| GLM-5.2 | $1.40 | $4.40 |
| GPT-5.5 | $5 | $30 |
| Claude Opus 4.5-4.8 | $5 | $25 |
但模型选型不能只看价目表。
Artificial Analysis 还测到一个麻烦点:GLM-5.2 每个 Intelligence Index 任务平均输出约 43K token。GLM-5.1 是 26K,MiniMax-M3 是 24K,Kimi K2.6 是 35K,DeepSeek V4 Pro max 是 37K。
这就把账拉回现实了。
API 单价是标价。任务总 token 才是账单。一个模型如果习惯长推理、长输出、长校验,便宜会被吃掉一部分。
还有能力不均衡。
Simon Willison 用两个 SVG prompt 做了轻量试玩。鹈鹕骑自行车效果很好,动画完整;北弗吉尼亚负鼠骑电动滑板车就差很多,甚至没有明显尝试动画。
这不是严肃 benchmark。不能拿它否定模型。
但它提醒了一个老问题:榜单高分不等于每个细分任务都稳。模型能力更像地形,不像水位。高处更高,坑也还在。
如果你是产品团队,现在更合理的动作不是立刻迁移,而是改评估表。
把“每百万 token 单价”改成“完成一个真实任务的总成本”。把“榜单分数”改成“你自己的 20 个高频任务”。把“能不能跑”改成“延迟、稳定性、输出长度能不能控”。
采购闭源编码模型的团队,也可以先慢半拍。不要急着签长期独家。GLM-5.2 这种开放权重模型,已经足以拿来压价,也足以做第二供应商。
开放权重不是慈善,是开发者入口之争
我更在意 GLM-5.2 背后的路线:低价、开放权重、长上下文、强编码。
这套组合拳打的不是普通聊天场景。它打的是模型基础设施的入口。
开放权重常被包装成社区精神。这个说法没错,但只说了一半。商业世界里,“天下熙熙,皆为利来”。开放权重也是抢生态、抢开发者、抢部署入口、抢议价权。
闭源模型卖的是稳定体验、产品封装和顶级能力。开放权重卖的是可控、可改、可本地化、可减少供应商锁定。
两边不是同一种生意,但会抢同一批预算。
对开发者来说,GLM-5.2 的吸引力很清楚:文本、代码、长上下文任务,可以开始认真测试。尤其是那些不想把核心流程完全绑在少数闭源 API 上的团队。
对自部署团队来说,账要算得更细。
1.51TB 权重不是下载完就结束。部署、推理、调度、缓存、监控,都会继续要钱。MoE 的效率优势,也不是写在论文里就自动兑现。系统工程吃不下来,模型再便宜也会变贵。
接下来最该看三件事。
- 真实任务总 token.43K output token 的倾向能不能被提示词、工具链和产品约束压住。
- 部署和服务稳定性.开放权重给了选择权,但没有免除运维成本。
- 编码任务一致性.WebDev 榜第二很强,但细分任务还要看自己的用例。
所以 GLM-5.2 的意义,不是“开放模型全面超过闭源模型”。这句话太满,也不准确。
它更像一个清晰信号:开放权重模型开始在高价值任务上具备真实替代性。不是玩具,不是备用胎,也不是只能靠情怀支持的路线。
闭源厂商还能赢。但不能再只靠一句“我们更强”。
开发者会算账。企业更会算账。谁能把能力、价格、稳定性和可控性一起交出来,谁才有下一轮模型基础设施的门票。
GLM-5.2 把这道题往前推了一格。分数已经摆在桌上,接下来该看账单和工程。
