有些公司现在正花心思让AI助手"说话变笨"——不是技术倒退,是故意让Claude、Codex这些模型用更短、更粗糙的方式作答,像穴居人一样惜字如金。原因很朴素:每一个输出token都在计费,模型说得越多,账单就越重。

这是404 Media最新一期播客的主题。同一期节目里,还有一件事同框出现:Etsy、eBay、Amazon上开始冒出AI生成的假花种子骗局。两件事看着不相关,却指向同一个变量——AI生成内容的边际成本被打到极低之后,谁来为规模买单。

三件事,几秒钟看完

  • Token计费让AI变贵.主流大模型按输出token收费,用得越深、跑得越久,账单涨得越猛。
  • 企业开始教AI少说话.已经有工具专门让Claude、Codex用更精简、甚至刻意粗糙的语言回答,减少输出token数,变相省钱。
  • 电商平台冒出AI假花骗局.Etsy、eBay、Amazon上出现大量用AI生成图片包装的"异域花卉种子",这些花根本不存在,消费者按图下单,种出来的东西完全对不上号。

以上信息来自播客简介和几篇关联报道的标题,细节还没有完全铺开。

token计费如何变成账单压力 调用量上升 (规模化使用) 按输出token计费 (说得越多越贵) 账单增长 (成本压力上升)

账单压力从哪来

早期AI产品是demo逻辑:烧钱换用户、换习惯,没人细算一次调用花多少钱。

现在潮水退了,按token计费的模式露出真面目:用得越深、越离不开,账单就跟着规模涨。这不是哪家企业乱花钱,是LLM的商业逻辑本身如此——算力是租来的,不是买断的,用一次付一次。

由俭入奢易,由奢入俭难。企业过去习惯砸钱做demo、做验证,真到大规模跑生产环境,才发现每次调用都在计价。

回头想省钱,不能简单少用AI,只能让AI说话更省——压缩输出、砍掉解释性文字、用更糙但token更少的方式回答同样的问题。

同一个问题,两种答法,两种账单 常规回复 完整解释 + 分步说明 输出token量高 单次调用成本更高 压缩回复(穴居人式) 短句、省略解释 语言更粗糙 token更少,成本更低

这里有个信号值得多看一眼:如果省钱的办法是让模型说得更短更糙,说明AI输出里本来就夹杂大量对结果没有增量贡献的token。那是模型的表达习惯,不是必要信息。企业现在开始给这部分"话痨倾向"定价。

这对谁意味着什么

你是谁现在能做的事
做AI产品、关注落地成本的从业者审查prompt和系统提示词长度,测试压缩输出对准确度的实际影响,评估是否要分级调用或换更便宜的模型
关注电商骗局的科技读者看到"异域花卉""稀有品种"种子广告,先查卖家历史评价,别只凭AI生成的美图下单

前者省的是运营成本,后者防的是被骗,但根子是一个:AI把内容生成成本打到极低之后,原来靠成本门槛挡住的问题,现在都得靠人自己多留一个心眼。

平台审核跟不上生成速度

Etsy、eBay、Amazon上出现大量AI生成的"异域花卉"种子广告,图片精美,花却不存在。种子买回去,种出的东西自然对不上宣传图。

这类骗局能成立,靠的不是复杂技术,是极低的生成成本。做一张以假乱真的花卉图,几秒钟、几乎零成本,比拍一张真实产品图还快还便宜。

这不是哪个平台在纵容,是平台的审核能力和激励结构,本来就没打算应对这种规模的内容生成。

低成本生成 + 弱审核 = 骗局流水线 AI生成 异域花卉图片 卖家挂上 Etsy/eBay/Amazon 消费者 按图下单种子 种出的花 与图片完全不符

早期互联网垃圾邮件泛滥,也是这套逻辑:发一封邮件的成本趋近于零,治理成本却要靠人力和规则慢慢补,永远慢半拍。AI生成内容,把这个规律又演了一遍。

天下熙熙,皆为利来。骗子从来不需要AI才会作恶,但AI把作恶的边际成本压到几乎为零——这才是真正该盯的变量,不是"AI又被拿去做坏事"这种老生常谈。

从企业砍token账单,到电商平台冒出AI假花,表面是两件不相关的事,底层是同一条线:AI的边际成本被打下来之后,总有人要为规模买单——要么是企业的财务部门,要么是平台的信任机制。demo阶段的AI几乎不要钱,也没人较真;规模化之后,成本和治理,才是决定这轮AI热潮能走多远的变量。

接下来值得看的,是有没有企业公开测算过压缩输出后的实际省钱幅度,以及电商平台会不会给AI生成图片单独设审核门槛。这两件事,目前都还看不清。