一个数字很刺眼:用户每月付 100 美元用 Claude Max,如果拿它接近满负荷跑 Claude Code,按 API 价格折算,消耗可能超过 1000 美元。
这不是 Anthropic 的官方财报。也不是说每个订阅用户都让公司亏 10 倍。它更像一个外部估算锚点:当 LLM 编程从“补几行代码”变成“读项目、改文件、调工具、反复试错”,那张账单会突然变厚。
我更在意的不是 AI 编程有没有用。它当然有用。真正的问题是:如果最像杀手级应用的场景,本身要靠高额补贴维持便宜感,这个商业故事就没那么顺了。
发生了什么:100 美元订阅,被拿来跑 1000 美元级别的 API 等价消耗
原文作者做了一个 Claude Code 实验:让它生成约 4 万行代码,做出一个可用但未完成的应用。
评价并不差。对有编程背景的人来说,这种体验很惊艳。很多原本没时间推进的东西,能被推到“能跑起来”。
但代价也露出来了:返工、回退、审查、上下文消耗,一个都没消失。
| 关键项 | 已知信息 | 该怎么理解 |
|---|---|---|
| 订阅价格 | Claude Max 100 美元/月 | 高强度用满时,可能明显低于 API 等价价 |
| 估算锚点 | Opus 4.6 API:输入约 5 美元/百万 token,输出约 25 美元/百万 token | 只能当外部价格参照,不等于厂商真实成本 |
| 使用方式 | Claude Code 做 agentic coding | 不只是聊天,还包括读代码、改文件、调工具、试错 |
| 实测结果 | 约 4 万行代码,可用但未完成 | 有产出,也有返工和管理成本 |
| 核心限制 | 单次复杂任务可能消耗百万级 token | 便宜的是简单问答,不一定是复杂工程任务 |
这里最容易误读的是一句话:token 单价下降,不等于任务成本下降。
普通聊天确实越来越便宜。摘要、润色、解释一段代码,成本已经接近可忽略。
但编程不是普通聊天。它要读仓库,要生成方案,要调用工具,要失败后重试,还要把上下文塞回去。一次复杂任务吃掉百万级 token,并不离谱。原文提到,单个高强度递归任务按 API 价估算可到几十美元。
所以那个“100 美元订阅跑出 1000 美元等价消耗”的判断,必须加限定:高强度、接近额度上限、agentic coding 场景。
离开这个条件,就容易把一个边界案例说成全局亏损。
为什么重要:AI 编程的贵,贵在看不见的递归
很多人对 LLM 成本的理解,还停在“输入多少字、输出多少字”。这套想象适合聊天,不适合 agentic coding。
真正烧钱的地方在后台。
模型可能先读文件,再规划;再改代码,再跑工具;报错后回看日志;修一轮,又引入新问题;上下文越来越长,输出越来越多。用户看到的是一句提示词。系统跑的是一串看不见的循环。
这就解释了一个反常点:模型单价在降,复杂任务却未必同步变便宜。
原因很简单。单价降一半,如果调用次数、上下文长度、试错轮数涨十倍,账单还是上去。
这对两类人影响最大。
一类是重度开发者。Claude Code、Copilot 类工具可以继续用,但任务要分层。小修小补、脚手架、测试补齐、代码解释,很适合。大规模重构、跨模块设计、含糊需求的自动实现,就要盯紧。别让模型用几十轮推理,替你证明一个需求本来就没想清楚。
另一类是技术管理者。别只看“代码行数变多”“提交变多”。要看返工率、回滚次数、review 时间、线上缺陷、单个功能的总成本。采购可以先上小范围试点,不要急着把团队工作流全部迁进去。尤其是预算敏感的团队,先算高强度使用场景,而不是拿轻量聊天成本做决策。
这不是保守。是把便宜幻觉剥掉。
AI 编程最像云计算早期的故事:先让你觉得资源便宜、扩容丝滑,后来才发现账单来自你没管理好的用量。两者不完全一样,但人性一样。只要边际成本被界面藏起来,浪费就会长出来。
真正该看什么:补贴退潮后,谁还负担得起
Anthropic 讲过 “When AI builds itself” 这样的叙事。它很有吸引力:AI 写更多代码,提交更多变更,提高研发速度,最后反过来加速 AI 自身进步。
这个故事有真东西。LLM 确实能帮会编程的人扩大产出。原文作者的实验也说明,Claude Code 能把一个应用推到可用状态。
我不买账的是另一层:把代码行数、提交量、成功率,直接换算成生产力。
代码不是棉布,不能只按产量算。工业革命里机器织布,产量上去,价格下来,消费者立刻受益。软件更麻烦。多一行代码可能是功能,也可能是债。提交量增加,可能是效率提升,也可能是模型迷路后不断回滚、修补、覆盖。
原文有个细节很关键:作者的 LLM check-in 变多,部分原因是方便在 Claude Code 走偏时回退。
这说明什么?说明很多“产出”旁边,其实站着一套安全绳。
古话说,“天下熙熙,皆为利来”。放在这里很准。大模型公司当然愿意补贴编程场景。开发者黏性强,付费意愿高,传播效果好,还能支撑“AI 正在写软件”的行业叙事。
但商业模式不能只靠叙事。API 单价可以降,缓存可以更聪明,模型可以更快。可只要复杂任务还依赖大量递归、工具调用和试错,成本就不会因为一句“token 便宜了”自动消失。
接下来真正该观察的不是发布会口径,而是四个变量:
| 观察变量 | 为什么重要 |
|---|---|
| 订阅额度是否收紧 | 如果高强度用户被限流,说明补贴压力在显形 |
| 高级模型是否继续分层 | 如果好模型只进更贵套餐,低价体验会变薄 |
| 企业套餐怎么定价 | 个人订阅可以补贴,企业采购更接近真实账本 |
| 工具是否减少无效递归 | 成本能不能降,关键看少走多少弯路 |
对开发者来说,最现实的动作不是弃用,而是分配任务。把 AI 当放大器,不要当无人驾驶。让它写,但人要拆任务、设边界、做 review。
对团队来说,更现实的动作是延后大规模迁移。先跑一组项目,看单位功能成本,而不是看演示里生成了多少行代码。
这篇文章提醒的不是“LLM 编程不行”。恰恰相反,它提醒我们:越有用的工具,越容易被便宜价格喂大依赖。
现在的问题不在产品,而在激励设计。厂商要增长,要叙事,要开发者习惯;用户要效率,要省钱,要少招人。两边都愿意暂时不看账本。
账本不会消失。它只是在补贴期里安静了一点。
