Scott Alexander 在 5 月 15 日发表《The Sigmoids Won't Save You》,讨论了 AI 圈里一个很常见的安慰说法:所有指数增长最后都会变成 S 曲线,所以 AI 能力也会自然放缓,不必太担心。
这句话最容易让人点头。它技术上没错,世界上没有永动机,任何增长都不可能无限持续。问题在于,它常被偷换成另一个判断:既然迟早会慢下来,那大概很快就会慢下来。
Alexander 真正反驳的是这一步。
他不是说指数增长会永远持续,也不是说 AI 一定会在某个时间点达到危险能力。他的核心判断更窄,也更硬:如果你没有一套机制模型,就不能凭“涨太久了”来断定拐点已经在眼前。
S 曲线是常识,但不能当预测捷径
S 曲线不是伪概念。
疫情传播会见顶,单一技术路线会遇到物理限制,市场渗透率也不可能超过 100%。早期加速、中期陡升、后期趋平,这套形状在很多地方都出现过。
但“最终会放缓”和“现在就会放缓”不是一回事。
前者是长期约束,后者是具体预测。中间必须回答一个问题:是什么机制让增长在这个时间点慢下来?是资源不够、成本太高、需求耗尽、监管收紧,还是技术路线撞墙?
Alexander 用三个误判案例说明,过早把趋势画成 S 曲线,常常不是因为模型更强,而是因为预测者先累了。
| 案例 | 当时的判断 | 后来暴露的问题 |
|---|---|---|
| 联合国生育率预测 | 多次预期低生育率国家的下降会放缓 | 真实生育率继续下行,拐点来得比预测更晚 |
| 太阳能部署预测 | 能源预测反复低估新增装机增长 | 成本下降、产业扩张和政策支持继续推高部署速度 |
| METR/Wharton AI 能力曲线预测 | 2026 年初尝试拟合 AI 能力趋平 | 后续模型发布很快打破原预测曲线 |
这些例子不证明指数增长能永远持续。它们只说明一件事:一句“差不多该停了”,不是预测。
太阳能是个好参照。外行容易只看装机曲线,觉得增长太快就该回落。可真正影响曲线的还有组件成本、融资条件、并网能力、政策补贴和供应链扩张。
AI 也类似。只看能力曲线,很难判断拐点。你还要看算力供给、算法效率、训练数据、推理成本和商业回报。任何一个变量都可能减速,但不能假装它们已经一起减速。
这对读者的影响很直接。
如果你是做 AI 工具迁移的企业负责人,不能只因为“模型可能快到头了”就推迟内部系统改造、员工培训和采购评估。更稳的做法是分阶段迁移:低风险流程先接入,高风险流程保留人工审核,把预算拆成可回撤的小步。
如果你是政策观察者,也不能把“S 曲线会来”当成风险自然消散。更该问的是:模型进入网络攻防、自动化研发、复杂代理任务时,评测、审计和责任边界有没有跟上。
没有机制模型时,Lindy 只是一个默认先验
Alexander 给出的替代框架并不复杂。
有机制模型,就看机制。没有机制模型,就别随手画一个 S 曲线。
他借用 Lindy 法则,是为了给“无知状态下怎么设默认预期”提供一个纪律。大意是:一个趋势已经持续多久,其中位预期可以参考它已经持续的时间。
这不是物理定律,也不是 AI 时间表。它不能告诉我们 AI 哪年达到高风险能力,也不能保证 scaling 会继续多久。
它的作用更像一个提醒:当你承认自己看不清完整机制,就不要同时自信地说拐点马上到来。
放到 AI 上,Alexander 的落点很明确。至少从 2017 年 GPT-1 发布算起,AI 已经经历了一段明显的能力提升;如果按很多人说的 scaling era,则大致从 2019 年算起。
无论从哪个起点算,这段扩展期都不能被随意假定即将结束。
更准确地说,举证责任在声称“AI 不会达到危险能力水平”的一方。这个人需要解释:算力为什么会停,算法效率为什么会停,数据为什么无法继续转化为能力,经济激励为什么不足以继续投入。
如果这些解释拿不出来,那就只能承认自己是在黑箱里判断。
当然,反方也不是没有强论点。数据枯竭、芯片供应、电力约束、训练成本、监管压力,都可能成为真实刹车。尤其是数据中心建设和电力接入,不是想扩就能扩。
但这些都属于机制问题。它们应该被具体讨论,而不是被一句“S 曲线迟早会来”打包带过。
接下来该盯什么,而不是盯曲线形状
AI 会不会放缓,关键不在图线像不像 S,而在几个变量有没有同时转向。
| 观察变量 | 如果继续支撑增长 | 如果开始形成刹车 |
|---|---|---|
| 算力与数据中心 | 训练集群、供电和芯片供给继续扩张 | 电力、建设周期、芯片或资本开支成为硬约束 |
| 算法效率 | 同等算力下能力继续提升 | 架构改进边际收益明显下降 |
| 数据与训练范式 | 合成数据、多模态数据、新训练方法继续有效 | 高质量数据耗尽,合成数据回报下降 |
| 推理时计算 | 通过更长思考、更强工具调用提升任务能力 | 推理成本过高,商业场景无法承受 |
| 评测与真实任务 | 模型在研发、代理、网络等任务上持续进步 | 基准分数上涨,但真实任务迁移变慢 |
这张表比一句“S 曲线”有用。
对企业来说,它决定的是采购节奏。不是盲目全押,也不是继续观望。更合理的动作是把 AI 投入分成两类:一类是已经能省成本的流程,尽快做;一类是依赖下一代模型能力的项目,保留试点,不急着重资产投入。
对开发团队来说,它决定的是工具路线。不要只押一个模型,也不要把所有系统写死在单一供应商接口上。模型能力还在变,抽象层、评测集和回滚方案反而更值钱。
对政策部门来说,重点不是预测某个具体日期,而是提前盯住能力阈值。比如模型是否能稳定完成长链路任务,是否能自主调用工具,是否能在网络、安全、生物等敏感领域降低门槛。
Alexander 这篇文章的价值,就在于把讨论拉回了预测纪律。
S 曲线会来,这点不用争。真正要争的是:它为什么来、何时来、由哪个约束触发。
如果这些问题没有答案,S 曲线就不是模型,只是把愿望画成了拐点。
