有些公司现在正花心思让AI助手"说话变笨"——不是技术倒退,是故意让Claude、Codex这些模型用更短、更粗糙的方式作答,像穴居人一样惜字如金。原因很朴素:每一个输出token都在计费,模型说得越多,账单就越重。
这是404 Media最新一期播客的主题。同一期节目里,还有一件事同框出现:Etsy、eBay、Amazon上开始冒出AI生成的假花种子骗局。两件事看着不相关,却指向同一个变量——AI生成内容的边际成本被打到极低之后,谁来为规模买单。
三件事,几秒钟看完
- Token计费让AI变贵.主流大模型按输出token收费,用得越深、跑得越久,账单涨得越猛。
- 企业开始教AI少说话.已经有工具专门让Claude、Codex用更精简、甚至刻意粗糙的语言回答,减少输出token数,变相省钱。
- 电商平台冒出AI假花骗局.Etsy、eBay、Amazon上出现大量用AI生成图片包装的"异域花卉种子",这些花根本不存在,消费者按图下单,种出来的东西完全对不上号。
以上信息来自播客简介和几篇关联报道的标题,细节还没有完全铺开。
账单压力从哪来
早期AI产品是demo逻辑:烧钱换用户、换习惯,没人细算一次调用花多少钱。
现在潮水退了,按token计费的模式露出真面目:用得越深、越离不开,账单就跟着规模涨。这不是哪家企业乱花钱,是LLM的商业逻辑本身如此——算力是租来的,不是买断的,用一次付一次。
由俭入奢易,由奢入俭难。企业过去习惯砸钱做demo、做验证,真到大规模跑生产环境,才发现每次调用都在计价。
回头想省钱,不能简单少用AI,只能让AI说话更省——压缩输出、砍掉解释性文字、用更糙但token更少的方式回答同样的问题。
这里有个信号值得多看一眼:如果省钱的办法是让模型说得更短更糙,说明AI输出里本来就夹杂大量对结果没有增量贡献的token。那是模型的表达习惯,不是必要信息。企业现在开始给这部分"话痨倾向"定价。
这对谁意味着什么
| 你是谁 | 现在能做的事 |
|---|---|
| 做AI产品、关注落地成本的从业者 | 审查prompt和系统提示词长度,测试压缩输出对准确度的实际影响,评估是否要分级调用或换更便宜的模型 |
| 关注电商骗局的科技读者 | 看到"异域花卉""稀有品种"种子广告,先查卖家历史评价,别只凭AI生成的美图下单 |
前者省的是运营成本,后者防的是被骗,但根子是一个:AI把内容生成成本打到极低之后,原来靠成本门槛挡住的问题,现在都得靠人自己多留一个心眼。
平台审核跟不上生成速度
Etsy、eBay、Amazon上出现大量AI生成的"异域花卉"种子广告,图片精美,花却不存在。种子买回去,种出的东西自然对不上宣传图。
这类骗局能成立,靠的不是复杂技术,是极低的生成成本。做一张以假乱真的花卉图,几秒钟、几乎零成本,比拍一张真实产品图还快还便宜。
这不是哪个平台在纵容,是平台的审核能力和激励结构,本来就没打算应对这种规模的内容生成。
早期互联网垃圾邮件泛滥,也是这套逻辑:发一封邮件的成本趋近于零,治理成本却要靠人力和规则慢慢补,永远慢半拍。AI生成内容,把这个规律又演了一遍。
天下熙熙,皆为利来。骗子从来不需要AI才会作恶,但AI把作恶的边际成本压到几乎为零——这才是真正该盯的变量,不是"AI又被拿去做坏事"这种老生常谈。
从企业砍token账单,到电商平台冒出AI假花,表面是两件不相关的事,底层是同一条线:AI的边际成本被打下来之后,总有人要为规模买单——要么是企业的财务部门,要么是平台的信任机制。demo阶段的AI几乎不要钱,也没人较真;规模化之后,成本和治理,才是决定这轮AI热潮能走多远的变量。
接下来值得看的,是有没有企业公开测算过压缩输出后的实际省钱幅度,以及电商平台会不会给AI生成图片单独设审核门槛。这两件事,目前都还看不清。
