Claude 4.7 改了分词器，真正涨的不是性能想象力，而是开发者账单

商业 2026年4月20日

核心摘要 Summary

Anthropic 在 Claude Opus 4.7 上更新了 tokenizer，表面上是文本和图像处理能力升级，落到开发者手里却先变成了更高的 token 成本。
真正重要的不是“多了几个 token”，而是同样标价下，模型迁移的预算、上下文设计和多模态工作流都要重算一遍。

内容导图 Mind Map

分词器迭代

Opus 4.7 更新分词规则引发实际成本攀升

标价未变账单先涨

同段内容在新版映射出更多 token

官方口径失真

实测 token 膨胀达 1.46 倍

底层设施成迁移变量

同代产品线内更替打破预算前提

多模态成本重构

高分辨率视觉能力打包进 token 账单

高清图像消耗激增

大尺寸图片 token 消耗暴涨至 3 倍

文档解析倍率可控

PDF 实测 token 倍率仅微涨

两类工作流承压

长提示词与文档解析团队必须复核预算

长上下文极易触顶

RAG 与 Agent 编排需重跑 token 审计

视觉处理需工程取舍

按需压缩图片或降级调用便宜模型

Anthropic 最新一代 Claude Opus 4.7，正在把一个常被忽视的基础层问题推到台前：同样一段内容，换个模型，token 数可能就不是一回事了。开发者 Simon Willison 把自己的 Claude Token Counter 工具升级后发现，Opus 4.7 是 Claude 系列里首个明确更换 tokenizer 的版本，和 4.6 相比，同一段系统提示词的 token 数达到 1.46 倍。

这件事的关键不在“技术细节更新”，而在它直接改写了使用成本。Anthropic 给 Opus 4.7 和 4.6 标的是同一档价格：每百万输入 token 5 美元、每百万输出 token 25 美元。但如果输入 token 膨胀四成，企业实际支出也会跟着抬升。对做长上下文、RAG、Agent 编排的人，这不是小数点后的误差，而是采购单上的真金白银。

分词器一换，模型价格表就不够看了

Anthropic 在 Opus 4.7 的发布说明里承认，新 tokenizer 会让同样输入映射成更多 token，官方给出的区间是 1.0 到 1.35 倍，视内容类型而定。Simon Willison 用公开提取出的 Opus 4.7 system prompt 去测，结果是 7335 token 对 5039 token，达到 1.46 倍，比官方口径还高一些。

这说明一个行业现实：模型定价页写的是“每百万 token 多少钱”，但用户真正买到的是“每段内容在这个 tokenizer 下会被切成多少 token”。两者不是一回事。过去开发者往往把 tokenizer 当成稳定底层设施，升级模型时主要比较能力、延迟和单价；现在这一层也成了迁移变量。

横向看，OpenAI、Google 这些主流模型也都有各自的分词方式，跨模型比较成本本来就不容易。Claude 4.7 的特殊之处在于，它不是换了厂商，而是在同一家产品线内部把这件事做出了可感知的成本差。对习惯“同代升级，预算大体不变”的团队来说，这会打乱不少默认前提。

图像和 PDF 的账，不能只看那张 3 倍截图

更容易吓到人的，是图像 token。Willison 测了一张 3456×2234、3.7MB 的 PNG，Opus 4.7 的 token 数是 4744，4.6 是 1578，差到 3.01 倍。但他随后补充，问题不在“4.7 天生更贵”，而在 4.7 支持更高分辨率图像，长边可到 2576 像素，约 3.75 百万像素，超过旧模型三倍以上。换成一张 682×318 的小图，4.7 和 4.6 分别是 314 和 310 token，几乎一样。

这组修正很重要。它提醒读者别把 token 上涨简单理解成“厂商变相涨价”。更准确的说法是：Anthropic 把更高分辨率视觉能力也打包进了 token 账单里。你如果真的用到了高分辨率解析、截图审查、文档视觉理解，那多出来的 token 可能对应的是新能力；如果只是日常 OCR、小图分类，成本未必明显增加。

PDF 的结果也说明，内容类型决定真实倍率。Willison 测试一份 15MB、30 页、文本密集型 PDF，Opus 4.7 报 60934 token，4.6 是 56482，只有 1.08 倍，远低于纯文本 system prompt 的差值。也就是说，别拿单一示例推导全部工作负载，企业上线前还是得自己跑样本集。

真正受影响的人，是做长提示词和多模态流程的团队

这条新闻最该让两类人停下来复核预算。

一类是重度依赖长系统提示词、知识库拼接、Agent 工具说明的开发团队。很多产品为了稳住输出，会把规则、角色、工具 schema、历史摘要一层层塞进上下文。tokenizer 变了以后，原本卡在 20 万或 50 万上下文边缘的提示词，可能更快触顶；原本算得过来的单次调用成本，也可能被放大。动作上很现实：要不要迁移到 4.7，不该只看 benchmark，还得先重跑 token 审计。

另一类是做文档理解和截图分析的企业客户。4.7 更高的图像分辨率支持，对法务审单、财报解析、复杂界面识别确实有吸引力，但前提是你真的需要那部分精度。很多团队过去买模型，喜欢盯着“能力最强”；接下来更像是在做工程取舍：高分图是否必要，是否应该先压缩图片，再送模型，是否该把不同任务分流给 Sonnet、Haiku 这类更便宜的型号。

这件事不那么重要的地方也要说清楚。它还谈不上是行业规则突变，更像是一次把“tokenizer 也会影响成本”这件事实锤到桌面上的案例。Anthropic 的 token counting API 允许对多个 Claude 型号计数，Willison 也把 Opus 4.7、4.6、Sonnet 4.6、Haiku 4.5 都放进了比较工具里。对普通聊天用户而言，这几乎无感；对 API 用户，尤其是预算精细到每千次调用的人，影响就很直接了。

锐评 Commentary

价目表未涨，账单先肥；分词器一动，成本立判。买模型，终究不能只听发布会，要看算术题。

token 成本AnthropicClaude Opus 4.7tokenizer模型定价开发者账单Simon WillisonRAG长上下文多模态工作流