在Anthropic的AI Engineer World's Fair大会上,Claude Code团队给出一个反直觉的建议:别再用死规则告诉AI什么时候该写测试、该用哪个模型,让它自己判断。写代码工具博主Simon Willison把这个建议记录了下来,还顺手做了个实验——用一句prompt让Claude Code学会把琐碎任务自动派给更便宜的模型执行。他说效果不错,token消耗速度变慢了

这条经验之所以值得深挖,不是因为它多新颖,而是因为它精准踩在一个时间点上:Fable相关产品线正处于涨价窗口期,省token从"顺手为之"变成了"抓紧行动"。但原文轻描淡写带过的三件事——涨价到底涨多少、这句prompt凭什么能生效、有没有人试了却失败——才是决定这个技巧能不能复制的关键。

涨价窗口期:从$2/$10到$3/$15

Jesse Vincent提醒Willison的那句话很直白:趁涨价前几天,让Fable把小任务甩给低算力模型。这里的涨价指的是Claude Sonnet 5的入门价,目前是输入每百万token 2美元、输出10美元,有效期到8月31日,之后涨到输入3美元、输出15美元。

对照来看,Opus 4.8定价是输入5美元、输出25美元,Haiku 4.5是输入1美元、输出5美元——三档模型之间本来就有五倍左右的价差。Fable本身也经历过一段访问受限,7月初恢复后,订阅条款转向按使用量计费。这些线索拼起来,比原文那句模糊的"prices go up"清楚得多:涨价是真实存在的,但它更像是Sonnet 5定价窗口到期,而不是Anthropic全线产品集体提价。

三档模型价格梯度(每百万token) Haiku 4.5 输入$1 / 输出$5 Sonnet 5(现价) 输入$2 / 输出$10 · 至8月31日 Sonnet 5(涨后) 输入$3 / 输出$15 Opus 4.8 输入$5 / 输出$25

一句prompt够不够:memory文件的边界

Willison测试时输入的prompt很简单——让Claude Code自己判断,把编码任务扔给低算力模型的子代理执行。系统确实生成了一份memory文件,记录下这个偏好,也确实提到了sonnet做实质性实现、haiku做机械性小改动的分工。

Claude Code官方文档说得很清楚:subagent的模型override必须在.claude/agents/目录下的子代理定义文件里显式设置,memory文件本身不会自动触发委派。换句话说,Willison这次操作能生效,大概率是因为他的项目里本来就有配置好的子代理定义,那句prompt只是唤醒了已有的机制,而不是凭空创造了委派能力。

  • 风险.如果读者只抄一句prompt、不建子代理定义文件,很可能达不到"token消耗变慢"的效果,白高兴一场。

这个细节容易被忽略,却决定了这个技巧能不能被普通开发者直接照搬。


判断驱动是趋势,但翻车案例也不少

从"写死规则"转向"让模型自己判断",本质是把决策权从人工逻辑挪到模型的元认知层面。这个方向听起来很顺——毕竟规则写得越细,越容易被边界情况绕过。但社区里的反馈没有原文那么乐观。

Reddit上有开发者报告subagent密集使用时出现路由异常或fallback行为不符合预期,配额消耗反而更快;甚至有帖子标题直接叫"bye Fable, we had a good run",暗示信任这套自动委派机制的用户,也有人中途放弃。

省token是真的,省心是假的
  • 结论.判断驱动能省钱,前提是主循环还得花时间审查子代理干得对不对。

这才是最容易被忽略的成本——把执行权交给低算力模型,看起来省了token,但审查责任并没有跟着下放,人力成本从"写规则"转移到了"查结果",账未必划算。

给普通开发者的实际动作

如果想复现Willison的效果,光在对话里说一句"用你的判断委派给低算力模型"大概率不够,得先在项目里建好.claude/agents/定义文件,明确写清楚哪些任务交给sonnet、哪些交给haiku,再让主模型学会调用。

接下来值得盯的,是Sonnet 5价格8月31日正式上调后,会不会有一批用户重新计算成本、转向更激进的委派策略;以及Anthropic会不会把这套"自动判断委派"做成官方内置功能,而不是让用户手动折腾subagent配置文件。眼下这套方法更像是少数熟练用户的手工优化,还谈不上普适方案。