让AI自己判断该派谁干活，省钱的代价是失控风险

核心摘要 Summary

Simon Willison用一句prompt让Claude Code自主判断把小任务扔给低算力模型执行，token消耗明显变慢，但这套方法能生效的前提是配置subagent定义文件，而不是靠一份memory文件；社区里同时流传着路由失灵、配额异常甚至弃用的抱怨。

在Anthropic的AI Engineer World's Fair大会上，Claude Code团队给出一个反直觉的建议：别再用死规则告诉AI什么时候该写测试、该用哪个模型，让它自己判断。写代码工具博主Simon Willison把这个建议记录了下来，还顺手做了个实验——用一句prompt让Claude Code学会把琐碎任务自动派给更便宜的模型执行。他说效果不错，token消耗速度变慢了。

这条经验之所以值得深挖，不是因为它多新颖，而是因为它精准踩在一个时间点上：Fable相关产品线正处于涨价窗口期，省token从"顺手为之"变成了"抓紧行动"。但原文轻描淡写带过的三件事——涨价到底涨多少、这句prompt凭什么能生效、有没有人试了却失败——才是决定这个技巧能不能复制的关键。

涨价窗口期：从$2/$10到$3/$15

Jesse Vincent提醒Willison的那句话很直白：趁涨价前几天，让Fable把小任务甩给低算力模型。这里的涨价指的是Claude Sonnet 5的入门价，目前是输入每百万token 2美元、输出10美元，有效期到8月31日，之后涨到输入3美元、输出15美元。

对照来看，Opus 4.8定价是输入5美元、输出25美元，Haiku 4.5是输入1美元、输出5美元——三档模型之间本来就有五倍左右的价差。Fable本身也经历过一段访问受限，7月初恢复后，订阅条款转向按使用量计费。这些线索拼起来，比原文那句模糊的"prices go up"清楚得多：涨价是真实存在的，但它更像是Sonnet 5定价窗口到期，而不是Anthropic全线产品集体提价。

一句prompt够不够：memory文件的边界

Willison测试时输入的prompt很简单——让Claude Code自己判断，把编码任务扔给低算力模型的子代理执行。系统确实生成了一份memory文件，记录下这个偏好，也确实提到了sonnet做实质性实现、haiku做机械性小改动的分工。

但Claude Code官方文档说得很清楚：subagent的模型override必须在.claude/agents/目录下的子代理定义文件里显式设置，memory文件本身不会自动触发委派。换句话说，Willison这次操作能生效，大概率是因为他的项目里本来就有配置好的子代理定义，那句prompt只是唤醒了已有的机制，而不是凭空创造了委派能力。

风险.如果读者只抄一句prompt、不建子代理定义文件，很可能达不到"token消耗变慢"的效果，白高兴一场。

这个细节容易被忽略，却决定了这个技巧能不能被普通开发者直接照搬。

判断驱动是趋势，但翻车案例也不少

从"写死规则"转向"让模型自己判断"，本质是把决策权从人工逻辑挪到模型的元认知层面。这个方向听起来很顺——毕竟规则写得越细，越容易被边界情况绕过。但社区里的反馈没有原文那么乐观。

Reddit上有开发者报告subagent密集使用时出现路由异常或fallback行为不符合预期，配额消耗反而更快；甚至有帖子标题直接叫"bye Fable, we had a good run"，暗示信任这套自动委派机制的用户，也有人中途放弃。

省token是真的，省心是假的

结论.判断驱动能省钱，前提是主循环还得花时间审查子代理干得对不对。

这才是最容易被忽略的成本——把执行权交给低算力模型，看起来省了token，但审查责任并没有跟着下放，人力成本从"写规则"转移到了"查结果"，账未必划算。

给普通开发者的实际动作

如果想复现Willison的效果，光在对话里说一句"用你的判断委派给低算力模型"大概率不够，得先在项目里建好.claude/agents/定义文件，明确写清楚哪些任务交给sonnet、哪些交给haiku，再让主模型学会调用。

接下来值得盯的，是Sonnet 5价格8月31日正式上调后，会不会有一批用户重新计算成本、转向更激进的委派策略；以及Anthropic会不会把这套"自动判断委派"做成官方内置功能，而不是让用户手动折腾subagent配置文件。眼下这套方法更像是少数熟练用户的手工优化，还谈不上普适方案。

让AI自己判断该派谁干活，省钱的代价是失控风险

AI委派省钱

涨价压力

配置前提

失控风险

审查成本

涨价窗口期：从$2/$10到$3/$15

一句prompt够不够：memory文件的边界

判断驱动是趋势，但翻车案例也不少

给普通开发者的实际动作