Simon Willison 最近摘引了 Boris Mann 在 Bluesky 上的一句话,短到像一句吐槽,但刀口很准:

“11 AI agents” is meaningless as a phrase.
If I said “I have 11 spreadsheets” or “I have 11 browser tabs” to do my work, it means about the same thing.

翻成白话:你说有 11 个 AI agents,信息量并不比“我开了 11 个表格”“我开了 11 个浏览器标签”更大。

这句话戳中的不是某个产品,而是当下 AI agent 叙事里一个越来越常见的毛病:用数量冒充能力,用编排复杂度冒充智能进步。

agent 不是计数单位

“11 个 spreadsheets”只能说明你用了很多表格,不能说明财务模型做得好。“11 个 browser tabs”只能说明你开了很多页面,不能说明研究结论更可靠。

AI agent 也是一样。

说法真正说明了什么没说明什么
11 个表格工具很多、文件很多分析是否正确
11 个浏览器标签信息来源很多判断是否成立
11 个 AI agents系统拆了很多角色任务是否能闭环

这里的重点不是否定 agent 技术。多 agent 编排当然可能有价值,尤其在复杂工作流里,拆分角色、并行执行、交叉检查,都可能提高效率。

问题在于,“几个 agent”本身不是能力描述。

一个像样的 agent,至少要说清几件事:它有没有明确目标?有没有状态记忆?能调用哪些工具?权限边界在哪里?失败后怎么反馈?结果如何验证?出了错谁负责?

这些不说,只报数量,就是把架构图当成绩单。

受影响的不是媒体读者,而是买单的人

这类话术最容易影响四类人。

AI 产品团队会被诱惑去堆名词:研究 agent、规划 agent、执行 agent、审核 agent、协调 agent。听起来井然有序,实际可能只是把一个不稳定流程切成了更多不稳定环节。

企业采购者更危险。采购会上,“我们有 11 个 agent 协同工作”比“我们把报销审核时间减少 37%”更炫,但后者才是业务语言。前者只会增加演示时的戏剧性,未必减少上线后的管理成本。

开发者也会被带偏。原本该问工具调用、权限控制、日志追踪、回滚机制、评测基准,最后变成讨论 agent 名字怎么起、角色怎么分、流程图怎么画。

普通用户则会获得一种错觉:agent 越多,系统越聪明。事实经常相反。模型看着更忙,产品反而更虚。

我的判断:行业在拿旧软件复杂度伪装成智能

我更在意的是,这波 agent 营销有很强的历史回声。

PC 时代,很多软件喜欢用“模块多”“功能全”证明自己先进;企业软件时代,又喜欢用复杂工作流、权限矩阵、审批链条证明自己专业。今天轮到 AI agent,旧习惯换了新皮肤。

“名不正,则言不顺。”这句话放在 agent 上很合适。一个概念如果边界不清,后面的销售、评估、采购、治理都会跟着变形。

当然,agent 不必被定义得像学术论文那么窄。行业早期,概念有弹性是正常的。可弹性不等于任意。至少,产品方应该回答一个朴素问题:这个 agent 独立接手了哪段工作?以前需要多少人工协调?现在减少了多少?失败率是多少?人类介入点在哪里?

答不上来,就别急着数人头。

真正的分水岭不在“一个 agent 还是十一个 agent”,而在它能不能把一个开放任务推进到可验证结果。能做到,一个也够有价值;做不到,十一个只是更拥挤的浏览器标签。

Boris Mann 这句话短,但提醒很实用:别被 agent 的数量吓住,也别被流程图里的小机器人哄住。AI 产品最后比的不是角色名单,而是责任闭环。

数量是最便宜的叙事。能力,才是最难伪装的东西。