GLM-5.2 这次最扎眼的地方,不是又有一个模型刷榜。

更关键的是:一个 MIT 许可开放完整权重的中国大模型,753B 参数,1M token 上下文,纯文本输入,却在开放权重模型榜单里打到第一梯队,还在 WebDev 编码榜排到第二。

这对开发者和 AI 产品团队很现实。闭源头部模型还没被打穿,但价格、开放权重和工程能力这三把刀,已经砍到它们的利润区。

发生了什么:GLM-5.2 把开放权重模型推到前排

Z.ai 在 6 月 13 日先向 coding plan subscribers 提供 GLM-5.2。6 月 16 日,完整权重开放,采用 MIT license。

模型很大。753B 参数,权重约 1.51TB,MoE 架构,约 40B active parameters。

它不是多模态模型。GLM-5.2 只支持文本输入。Z.ai 另有视觉模型线,比如 GLM-5V-Turbo,但那不是这次开放权重的主角。

项目GLM-5.2该怎么理解
开放方式完整权重,MIT license商业使用和二次部署更友好
模型规模753B 参数,约 1.51TB不是小团队随手能跑的模型
架构MoE,约 40B active parameters推理效率要靠工程系统兑现
输入形态纯文本不能误读成多模态突破
上下文1M tokenGLM-5.1 是 200K,长上下文明显加码

Artificial Analysis Intelligence Index v4.1 给 GLM-5.2 的分数是 51。它领先 MiniMax-M3、DeepSeek V4 Pro、Kimi K2.6。这个榜不是全部真理,但在独立评测里有参考价值。

Code Arena WebDev leaderboard 上,它排第二,仅次于 Claude Fable 5。这个结果反而更有信息量。

因为 GLM-5.2 没有图像输入。

它能在前端 Web 开发和 agentic coding 任务里冲到这个位置,至少说明一件事:前端编码能力不完全依赖“看图”。很多任务里,读懂需求、拆步骤、写结构化代码,比视觉输入更要命。

对做编码助手、内部研发平台、自动化前端生成的团队来说,这已经足够进入候选名单。不是直接替换闭源模型,而是必须纳入 POC。

便宜是真便宜,但低单价不等于低总成本

OpenRouter 上,GLM-5.2 来自 9 个供应商。多数报价约为每百万 input token 1.40 美元、output token 4.40 美元。

和闭源头部模型比,单价差距很大。

模型Input / 1M tokenOutput / 1M token
GLM-5.2$1.40$4.40
GPT-5.5$5$30
Claude Opus 4.5-4.8$5$25

但模型选型不能只看价目表。

Artificial Analysis 还测到一个麻烦点:GLM-5.2 每个 Intelligence Index 任务平均输出约 43K token。GLM-5.1 是 26K,MiniMax-M3 是 24K,Kimi K2.6 是 35K,DeepSeek V4 Pro max 是 37K。

这就把账拉回现实了。

API 单价是标价。任务总 token 才是账单。一个模型如果习惯长推理、长输出、长校验,便宜会被吃掉一部分。

还有能力不均衡。

Simon Willison 用两个 SVG prompt 做了轻量试玩。鹈鹕骑自行车效果很好,动画完整;北弗吉尼亚负鼠骑电动滑板车就差很多,甚至没有明显尝试动画。

这不是严肃 benchmark。不能拿它否定模型。

但它提醒了一个老问题:榜单高分不等于每个细分任务都稳。模型能力更像地形,不像水位。高处更高,坑也还在。

如果你是产品团队,现在更合理的动作不是立刻迁移,而是改评估表。

把“每百万 token 单价”改成“完成一个真实任务的总成本”。把“榜单分数”改成“你自己的 20 个高频任务”。把“能不能跑”改成“延迟、稳定性、输出长度能不能控”。

采购闭源编码模型的团队,也可以先慢半拍。不要急着签长期独家。GLM-5.2 这种开放权重模型,已经足以拿来压价,也足以做第二供应商。

开放权重不是慈善,是开发者入口之争

我更在意 GLM-5.2 背后的路线:低价、开放权重、长上下文、强编码。

这套组合拳打的不是普通聊天场景。它打的是模型基础设施的入口。

开放权重常被包装成社区精神。这个说法没错,但只说了一半。商业世界里,“天下熙熙,皆为利来”。开放权重也是抢生态、抢开发者、抢部署入口、抢议价权。

闭源模型卖的是稳定体验、产品封装和顶级能力。开放权重卖的是可控、可改、可本地化、可减少供应商锁定。

两边不是同一种生意,但会抢同一批预算。

对开发者来说,GLM-5.2 的吸引力很清楚:文本、代码、长上下文任务,可以开始认真测试。尤其是那些不想把核心流程完全绑在少数闭源 API 上的团队。

对自部署团队来说,账要算得更细。

1.51TB 权重不是下载完就结束。部署、推理、调度、缓存、监控,都会继续要钱。MoE 的效率优势,也不是写在论文里就自动兑现。系统工程吃不下来,模型再便宜也会变贵。

接下来最该看三件事。

  • 真实任务总 token.43K output token 的倾向能不能被提示词、工具链和产品约束压住。
  • 部署和服务稳定性.开放权重给了选择权,但没有免除运维成本。
  • 编码任务一致性.WebDev 榜第二很强,但细分任务还要看自己的用例。

所以 GLM-5.2 的意义,不是“开放模型全面超过闭源模型”。这句话太满,也不准确。

它更像一个清晰信号:开放权重模型开始在高价值任务上具备真实替代性。不是玩具,不是备用胎,也不是只能靠情怀支持的路线。

闭源厂商还能赢。但不能再只靠一句“我们更强”。

开发者会算账。企业更会算账。谁能把能力、价格、稳定性和可控性一起交出来,谁才有下一轮模型基础设施的门票。

GLM-5.2 把这道题往前推了一格。分数已经摆在桌上,接下来该看账单和工程。