GLM-5.2 开放权重：分数很强，账单还要重算

核心摘要 Summary

Z.ai 已在 6 月 16 日开放 GLM-5.2 完整权重，MIT 许可，753B 参数，1M token 上下文，当前在多个开放权重模型评测中站到前排。
它的分水岭不只是分数高，而是用开放权重、低 API 单价和编码能力继续挤压闭源模型。
问题也很硬：输出 token 消耗高，部署门槛重，能力并不均匀。

GLM-5.2 这次最扎眼的地方，不是又有一个模型刷榜。

更关键的是：一个 MIT 许可开放完整权重的中国大模型，753B 参数，1M token 上下文，纯文本输入，却在开放权重模型榜单里打到第一梯队，还在 WebDev 编码榜排到第二。

这对开发者和 AI 产品团队很现实。闭源头部模型还没被打穿，但价格、开放权重和工程能力这三把刀，已经砍到它们的利润区。

发生了什么：GLM-5.2 把开放权重模型推到前排

Z.ai 在 6 月 13 日先向 coding plan subscribers 提供 GLM-5.2。6 月 16 日，完整权重开放，采用 MIT license。

模型很大。753B 参数，权重约 1.51TB，MoE 架构，约 40B active parameters。

它不是多模态模型。GLM-5.2 只支持文本输入。Z.ai 另有视觉模型线，比如 GLM-5V-Turbo，但那不是这次开放权重的主角。

项目	GLM-5.2	该怎么理解
开放方式	完整权重，MIT license	商业使用和二次部署更友好
模型规模	753B 参数，约 1.51TB	不是小团队随手能跑的模型
架构	MoE，约 40B active parameters	推理效率要靠工程系统兑现
输入形态	纯文本	不能误读成多模态突破
上下文	1M token	GLM-5.1 是 200K，长上下文明显加码

Artificial Analysis Intelligence Index v4.1 给 GLM-5.2 的分数是 51。它领先 MiniMax-M3、DeepSeek V4 Pro、Kimi K2.6。这个榜不是全部真理，但在独立评测里有参考价值。

Code Arena WebDev leaderboard 上，它排第二，仅次于 Claude Fable 5。这个结果反而更有信息量。

因为 GLM-5.2 没有图像输入。

它能在前端 Web 开发和 agentic coding 任务里冲到这个位置，至少说明一件事：前端编码能力不完全依赖“看图”。很多任务里，读懂需求、拆步骤、写结构化代码，比视觉输入更要命。

对做编码助手、内部研发平台、自动化前端生成的团队来说，这已经足够进入候选名单。不是直接替换闭源模型，而是必须纳入 POC。

便宜是真便宜，但低单价不等于低总成本

OpenRouter 上，GLM-5.2 来自 9 个供应商。多数报价约为每百万 input token 1.40 美元、output token 4.40 美元。

和闭源头部模型比，单价差距很大。

模型	Input / 1M token	Output / 1M token
GLM-5.2	$1.40	$4.40
GPT-5.5	$5	$30
Claude Opus 4.5-4.8	$5	$25

但模型选型不能只看价目表。

Artificial Analysis 还测到一个麻烦点：GLM-5.2 每个 Intelligence Index 任务平均输出约 43K token。GLM-5.1 是 26K，MiniMax-M3 是 24K，Kimi K2.6 是 35K，DeepSeek V4 Pro max 是 37K。

这就把账拉回现实了。

API 单价是标价。任务总 token 才是账单。一个模型如果习惯长推理、长输出、长校验，便宜会被吃掉一部分。

还有能力不均衡。

Simon Willison 用两个 SVG prompt 做了轻量试玩。鹈鹕骑自行车效果很好，动画完整；北弗吉尼亚负鼠骑电动滑板车就差很多，甚至没有明显尝试动画。

这不是严肃 benchmark。不能拿它否定模型。

但它提醒了一个老问题：榜单高分不等于每个细分任务都稳。模型能力更像地形，不像水位。高处更高，坑也还在。

如果你是产品团队，现在更合理的动作不是立刻迁移，而是改评估表。

把“每百万 token 单价”改成“完成一个真实任务的总成本”。把“榜单分数”改成“你自己的 20 个高频任务”。把“能不能跑”改成“延迟、稳定性、输出长度能不能控”。

采购闭源编码模型的团队，也可以先慢半拍。不要急着签长期独家。GLM-5.2 这种开放权重模型，已经足以拿来压价，也足以做第二供应商。

开放权重不是慈善，是开发者入口之争

我更在意 GLM-5.2 背后的路线：低价、开放权重、长上下文、强编码。

这套组合拳打的不是普通聊天场景。它打的是模型基础设施的入口。

开放权重常被包装成社区精神。这个说法没错，但只说了一半。商业世界里，“天下熙熙，皆为利来”。开放权重也是抢生态、抢开发者、抢部署入口、抢议价权。

闭源模型卖的是稳定体验、产品封装和顶级能力。开放权重卖的是可控、可改、可本地化、可减少供应商锁定。

两边不是同一种生意，但会抢同一批预算。

对开发者来说，GLM-5.2 的吸引力很清楚：文本、代码、长上下文任务，可以开始认真测试。尤其是那些不想把核心流程完全绑在少数闭源 API 上的团队。

对自部署团队来说，账要算得更细。

1.51TB 权重不是下载完就结束。部署、推理、调度、缓存、监控，都会继续要钱。MoE 的效率优势，也不是写在论文里就自动兑现。系统工程吃不下来，模型再便宜也会变贵。

接下来最该看三件事。

真实任务总 token.43K output token 的倾向能不能被提示词、工具链和产品约束压住。
部署和服务稳定性.开放权重给了选择权，但没有免除运维成本。
编码任务一致性.WebDev 榜第二很强，但细分任务还要看自己的用例。

所以 GLM-5.2 的意义，不是“开放模型全面超过闭源模型”。这句话太满，也不准确。

它更像一个清晰信号：开放权重模型开始在高价值任务上具备真实替代性。不是玩具，不是备用胎，也不是只能靠情怀支持的路线。

闭源厂商还能赢。但不能再只靠一句“我们更强”。

开发者会算账。企业更会算账。谁能把能力、价格、稳定性和可控性一起交出来，谁才有下一轮模型基础设施的门票。

GLM-5.2 把这道题往前推了一格。分数已经摆在桌上，接下来该看账单和工程。

GLM-5.2 开放权重：分数很强，账单还要重算

GLM 5.2

开放上位

权重开放

成本重算

输出偏长

能力落差

文本强项

部署门槛

权重庞大

发生了什么：GLM-5.2 把开放权重模型推到前排

便宜是真便宜，但低单价不等于低总成本

开放权重不是慈善，是开发者入口之争