Anthropic 最新一代 Claude Opus 4.7,正在把一个常被忽视的基础层问题推到台前:同样一段内容,换个模型,token 数可能就不是一回事了。开发者 Simon Willison 把自己的 Claude Token Counter 工具升级后发现,Opus 4.7 是 Claude 系列里首个明确更换 tokenizer 的版本,和 4.6 相比,同一段系统提示词的 token 数达到 1.46 倍。
这件事的关键不在“技术细节更新”,而在它直接改写了使用成本。Anthropic 给 Opus 4.7 和 4.6 标的是同一档价格:每百万输入 token 5 美元、每百万输出 token 25 美元。但如果输入 token 膨胀四成,企业实际支出也会跟着抬升。对做长上下文、RAG、Agent 编排的人,这不是小数点后的误差,而是采购单上的真金白银。
分词器一换,模型价格表就不够看了
Anthropic 在 Opus 4.7 的发布说明里承认,新 tokenizer 会让同样输入映射成更多 token,官方给出的区间是 1.0 到 1.35 倍,视内容类型而定。Simon Willison 用公开提取出的 Opus 4.7 system prompt 去测,结果是 7335 token 对 5039 token,达到 1.46 倍,比官方口径还高一些。
这说明一个行业现实:模型定价页写的是“每百万 token 多少钱”,但用户真正买到的是“每段内容在这个 tokenizer 下会被切成多少 token”。两者不是一回事。过去开发者往往把 tokenizer 当成稳定底层设施,升级模型时主要比较能力、延迟和单价;现在这一层也成了迁移变量。
横向看,OpenAI、Google 这些主流模型也都有各自的分词方式,跨模型比较成本本来就不容易。Claude 4.7 的特殊之处在于,它不是换了厂商,而是在同一家产品线内部把这件事做出了可感知的成本差。对习惯“同代升级,预算大体不变”的团队来说,这会打乱不少默认前提。
图像和 PDF 的账,不能只看那张 3 倍截图
更容易吓到人的,是图像 token。Willison 测了一张 3456×2234、3.7MB 的 PNG,Opus 4.7 的 token 数是 4744,4.6 是 1578,差到 3.01 倍。但他随后补充,问题不在“4.7 天生更贵”,而在 4.7 支持更高分辨率图像,长边可到 2576 像素,约 3.75 百万像素,超过旧模型三倍以上。换成一张 682×318 的小图,4.7 和 4.6 分别是 314 和 310 token,几乎一样。
这组修正很重要。它提醒读者别把 token 上涨简单理解成“厂商变相涨价”。更准确的说法是:Anthropic 把更高分辨率视觉能力也打包进了 token 账单里。你如果真的用到了高分辨率解析、截图审查、文档视觉理解,那多出来的 token 可能对应的是新能力;如果只是日常 OCR、小图分类,成本未必明显增加。
PDF 的结果也说明,内容类型决定真实倍率。Willison 测试一份 15MB、30 页、文本密集型 PDF,Opus 4.7 报 60934 token,4.6 是 56482,只有 1.08 倍,远低于纯文本 system prompt 的差值。也就是说,别拿单一示例推导全部工作负载,企业上线前还是得自己跑样本集。
真正受影响的人,是做长提示词和多模态流程的团队
这条新闻最该让两类人停下来复核预算。
一类是重度依赖长系统提示词、知识库拼接、Agent 工具说明的开发团队。很多产品为了稳住输出,会把规则、角色、工具 schema、历史摘要一层层塞进上下文。tokenizer 变了以后,原本卡在 20 万或 50 万上下文边缘的提示词,可能更快触顶;原本算得过来的单次调用成本,也可能被放大。动作上很现实:要不要迁移到 4.7,不该只看 benchmark,还得先重跑 token 审计。
另一类是做文档理解和截图分析的企业客户。4.7 更高的图像分辨率支持,对法务审单、财报解析、复杂界面识别确实有吸引力,但前提是你真的需要那部分精度。很多团队过去买模型,喜欢盯着“能力最强”;接下来更像是在做工程取舍:高分图是否必要,是否应该先压缩图片,再送模型,是否该把不同任务分流给 Sonnet、Haiku 这类更便宜的型号。
这件事不那么重要的地方也要说清楚。它还谈不上是行业规则突变,更像是一次把“tokenizer 也会影响成本”这件事实锤到桌面上的案例。Anthropic 的 token counting API 允许对多个 Claude 型号计数,Willison 也把 Opus 4.7、4.6、Sonnet 4.6、Haiku 4.5 都放进了比较工具里。对普通聊天用户而言,这几乎无感;对 API 用户,尤其是预算精细到每千次调用的人,影响就很直接了。
