一个反常点越来越清楚:AI 行业最爱讲“通用”,真正交成绩的地方,却常常很窄。
AlphaFold 的突破,不是靠一个什么都能聊的助手,而是把蛋白质结构预测这件事打穿。企业买 AI 也类似。采购会上没人长期为“它什么都能聊”付高价,真正被追问的总是三件事:能不能控,准不准,贵不贵。
Dharma AI 最近解读了 Goldfeder、Wyder、LeCun、Shwartz-Ziv 2026 年论文《AI Must Embrace Specialization via Superhuman Adaptable Intelligence》。这篇论文要推的不是“通用 AI 会失败”,而是更现实的一层:资源有限时,通用能力要兑现价值,往往要靠专业化来收口。
论文真正说的是:匹配胜过宽泛
这篇论文有意思的地方,不是喊“垂直模型有机会”。这种话已经说滥了。
它把同一个结论从几条线压出来:AI 系统在有限算力、有限数据、有限研发时间下,很难无限摊薄自己。覆盖越广,单点性能越难保证。
| 证据线 | 核心意思 | 对 AI 的含义 |
|---|---|---|
| 无免费午餐定理 | 不存在在所有问题上都占优的通用优化算法 | 优势来自对目标问题的匹配 |
| 有限资源约束 | 算力、数据、时间被摊到太多任务上 | 每个任务拿到的有效资源会变薄 |
| 进化与市场 | 资源有限时,生态位和竞争会筛出适配者 | 活下来的常不是最全能,而是最合身 |
| 机器学习实践 | 多任务负迁移、MoE 路由、AlphaFold 都显示任务聚焦的价值 | 宽度常要靠内部或外部的分工支撑 |
无免费午餐定理尤其适合给今天的大模型热降温。它不是说通用 AI 不可能。它说的是:通用性本身不等于性能优势。
一个系统在某类问题上赢,通常因为它对那类问题做了更好的适配。模型越进入生产环境,这笔账越冷。
企业不买抽象能力。企业买的是某个流程里少出错、少返工、少花钱。
别把“苦涩教训”读反
这里最容易误读 Sutton 的 Bitter Lesson。
“苦涩教训”反对的,是人类把手写规则、领域经验、过度工程先验硬塞进系统。它赞成的是让计算和数据自己学出结构。
但 domain knowledge 和 domain specialization 不是一回事。
前者是“我替模型规定世界该长什么样”。后者是“我决定把资源集中投向一个边界清楚的问题”。这两件事不能混为一谈。
AlphaFold 不能证明所有垂直模型都会爆发同等级突破。这个结论太大,证据不够。但它至少说明:当任务边界足够清楚、评估目标足够明确、数据和方法能围绕目标组织时,专业化会释放很强的工程效率。
MoE 也只能谨慎地看。它不是“专业化必然胜利”的定理。但它给了一个合理暗示:很多所谓通用系统,内部并不是所有参数一锅炖,而是在做专家路由和分工。
通用外壳下面,仍然有专业化的影子。
古人说“术业有专攻”。放到 AI 上,这句话一点也不旧。技术越先进,资源分配越现实。算力、电力、数据、工程师时间,没有一样是无限的。
企业该看什么:别把通用能力当落地方案
我更在意的不是这篇论文能不能一锤定音,而是它戳中了 AI 落地的激励结构。
通用大模型适合融资、发布会和平台入口。专业化系统适合报销、验收和长期使用。前者讲想象空间,后者交付责任边界。
最受影响的主要是两类人。
| 对象 | 该怎么调整 | 该盯的变量 |
|---|---|---|
| 企业 AI 采购负责人 | 少比参数和榜单,多比任务成功率、错误成本、权限控制、单位调用成本 | RFP 是否从“模型能力”转向“流程指标”和 SLA |
| 技术产品负责人 | 少押一个通用助手吃掉所有场景,多做底座模型 + 工具链 + 专业工作流 | 架构是否从单点聊天框转向可审计的任务系统 |
采购负责人最现实的动作,是延后那种“先买一个大模型平台再慢慢找场景”的单子。至少要把场景切细,再问供应商三件事:错误怎么发现,责任怎么追,成本怎么封顶。
产品团队也要改。别把所有需求都塞进一个聊天入口。客服、法务、研发、财务,看起来都能被同一个助手覆盖,落地时却有完全不同的容错率、数据边界和审批链条。
这就是专业化真正值钱的地方。它不是让模型看起来更酷,而是让失败变得可定位、可修复、可计价。
历史上类似的事不新鲜。铁路早期卖的是改变世界,成熟后拼线路密度、准点率和单位运力。云计算早期卖弹性叙事,后来企业真正在意的是负载、权限、SLA 和账单。
AI 不完全一样。但重复的是同一种商业逻辑:宏大平台负责打开想象,专业系统负责结算价值。
接下来最该观察的变量,不是哪个通用模型又刷新了榜单。而是企业采购表里,评估项有没有从“能力展示”转向“流程可靠性”;产品架构有没有从“一个万能助手”转向“底座模型加专业系统”。
如果这两个变量开始变硬,专业化就不再只是论文里的判断,而会变成预算表里的选择。
通用能力当然有价值。它会继续做底座、入口和能力供给层。问题在于,底座不是交付。原材料不是施工图。
没有边界、指标和责任链,再强的通用模型也只是堆在工地上的钢材。
