Anthropic CEO Dario Amodei 在 2026 年 6 月发表《Policy on the AI Exponential》,核心建议很直接:超过一定算力阈值的前沿模型,应接受第三方测试和审计;在特定重大风险下,政府可以阻止或撤回部署。
这个判断比一般的“AI 要不要监管”更具体。
Amodei 盯住的是一个时间差:模型能力按月推进,政治制度按年反应。他用《指环王》里的树胡和霍比特打比方。AI 像急着求援的霍比特,政治制度像说一句问候都要很久的树胡。
比喻有点文学,问题很现实:慢政遇疾技,靠透明度够不够?
从披露到准入:前沿模型被放进“高风险产品”框架
Amodei 承认,2023 到 2025 年,Anthropic 更倾向透明度路线。
那时的重点是披露安全流程、测试结果和重大事故。这个思路并不奇怪。风险还没完全成形时,提前把规则写死,可能只会制造合规文件,反而抓不住真正危险。
现在 Anthropic 的判断变了。
它认为前沿模型风险已经不只是论文里的假设。最靠前的是网络安全风险,其次包括潜在生物风险和自主性风险。Amodei 还提到 Claude Mythos Preview 及相关红队评估,意思是这类模型的能力变化,已经足以让安全政策重新估算边界。
这里要避免误读。它不是要求全面禁止 AI,也不是把所有模型都纳入同一把尺子。
Amodei 的政策建议更窄:只对超过算力阈值的模型设置强制测试;政府阻断权也只针对网络、生物、失控、自动化研发四类重大风险。
可以把监管类比放在一起看:
| 监管类比 | 对 AI 的含义 | Amodei 的判断 |
|---|---|---|
| 社交应用、加密货币 | 先上线,风险多靠市场、舆论和事后执法消化 | 不足以处理前沿模型 |
| 飞机、汽车、药品 | 上线前测试,出问题可禁飞、召回、限制使用 | 更接近当前前沿 AI 的监管需求 |
| 核材料 | 极端情况下,涉及更高等级的国家治理和安全控制 | 未来在极端风险下才可能接近 |
我更在意的是这个类比变化。
如果 AI 只是社交应用,监管可以慢一点,看市场怎么反应。如果 AI 更像飞机和药品,逻辑就变了:不能等事故发生后再补流程。上市前测试,本身就是产品的一部分。
谁最受影响:大模型公司、采购方和投资人
如果这套思路进入美国联邦政策,最先受影响的不是普通聊天机器人用户,而是训练和部署前沿模型的公司。
算力阈值、第三方测试资质、模型权重安全、红队测试、事故报告,都会变成发布节奏的一部分。产品发布不再像传统软件那样“先上线再修补”,更像航空业的适航审查。
这会带来两个结果。
一个是成本上升。安全团队、合规流程、外部评估、政府沟通,都会占用时间和预算。
另一个是头部优势变强。资金更厚、法务更强、安全团队更完整的公司,更容易适应这套制度。小公司未必不能创新,但想进入最前沿训练竞赛,会更难。
对企业采购方,动作也会变。
金融、能源、医药、云服务商接入高能力模型时,不能只看价格、上下文长度和推理效果。它们会更关心供应商是否通过第三方评估,事故上报机制怎么设计,模型权重怎么保护,高风险能力有没有隔离。
最现实的变化可能是:采购延后,试点变长,合同里多出安全评估和责任条款。
对 AI 政策和监管关注者,这篇文章的信号也很明确:争论焦点会从“要不要披露”转到“谁来测、按什么标准测、测不过能不能拦”。
对科技公司管理层和投资人,重点则是重新给风险定价。模型能力强不再自动等于发布更快、收入更快。合规能力、安全工程能力和政策沟通能力,会成为前沿 AI 公司的硬资产。
现实约束也在这里。
第三方测试并不是万能答案。测试机构是否足够独立,标准是否会落后于模型能力,政府是否具备判断技术风险的能力,都还看不清。闸门装得太低,会拖慢普通创新;装得太高,又可能等风险成形才反应。
这才是政策难点。
就业和增长:问题不止是安全,还包括分配
Amodei 还把宏观经济放进同一篇文章。这个部分更有争议,也更容易被误读。
他的判断不是“AI 已经造成永久性失业”,而是一个条件判断:如果强 AI 能完成大量认知任务,它可能同时带来超高速增长和持久性就业替代。
这会改变政策重心。
过去很多技术政策默认一件事:先刺激增长,再让市场和教育系统慢慢吸收冲击。汽车替代马车,自动化改造制造业,历史上都创造过新岗位。
但大模型复制的是更一般的脑力能力,冲击面可能更宽。若替代速度太快,新岗位未必能按过去节奏长出来。
所以 Amodei 把问题推到分配层面:如果 AI 真带来巨大增长,政策重点可能不再只是“怎样做大蛋糕”,还包括“怎样分配收益”,以及“人在工作、身份和意义感上怎么办”。
这不是抒情问题。对公司来说,这是组织设计问题;对政府来说,这是税收、社保、教育和公共服务问题;对投资人来说,这是需求结构和社会稳定的长期变量。
接下来最该看三件事。
| 观察点 | 为什么重要 | 可能影响 |
|---|---|---|
| 美国是否把前沿模型测试写入联邦规则 | 决定它是行业倡议,还是硬约束 | 影响模型发布节奏和合规投入 |
| 第三方评估由谁承担 | 决定测试是公共监管,还是受监管的私营市场 | 影响标准可信度和执行成本 |
| 算力阈值怎么设 | 决定哪些模型进入强监管范围 | 阈值过低压创新,过高挡不住风险 |
回到开头那只树胡。
政治制度慢,不一定是坏事。慢有时意味着审慎,意味着不能被一家公司、一篇文章或一次恐慌牵着走。
但如果模型能力真的进入指数级推进,慢就不能等于只看不动。前沿 AI 监管最需要的不是大口号,而是一套窄刀口的制度:测得清,拦得住,也别把不该拦的东西一并拦死。
