Anthropic 扩大 Project Glasswing：AI 找洞破万，补丁链路才是真战场

核心摘要 Summary

Anthropic 正把 Project Glasswing 从约 50 家合作伙伴扩大到新增约 150 家组织，覆盖电力、水务、医疗、通信、硬件等关键基础设施。
初始合作方已用 Claude Mythos Preview 发现超过 1 万个高危或严重漏洞，但最要紧的问题不是“AI 能不能找洞”，而是这些洞有多少被确认、披露、修好并部署到生产系统里。

Anthropic 这次给 Project Glasswing 扩容，最扎眼的数字不是 150 家新增合作组织，而是前一批合作方已经发现了超过 1 万个高危或严重漏洞。

问题也卡在这里：发现了，不等于修好了。Anthropic 没有说这 1 万多个漏洞已经全部完成修复。

这件事的主线因此更清楚了。AI 安全模型正在把漏洞发现这一步加速，但软件世界真正吃紧的地方，正在从“找不到洞”变成“补不上洞”。刀快了，后面的手还没跟上。

发生了什么：Glasswing 扩容，但 Mythos 仍被关在门里

Project Glasswing 是 Anthropic 面向网络安全防守方的合作计划。它使用 Claude Mythos Preview 扫描关键软件代码库，帮助发现漏洞，并辅助补丁工作。

现在规模扩大了：

关键信息	当前变化	真正含义
合作规模	原有约 50 家合作伙伴，新增约 150 家组织	从小范围试点转向审核扩张
覆盖国家	新增组织来自 15 个以上国家	不再只是少数样板客户
行业范围	电力、水务、医疗、通信、硬件等	更贴近关键基础设施风险
已发现漏洞	初始合作方发现超过 1 万个高危或严重漏洞	AI 找洞能力已进入实战区
开放状态	仍非公众开放，需满足安全要求	Anthropic 还不敢把这把刀随便发出去

最容易误读的一点，是把它看成“安全版 Claude 开放给大家用”。不是。

Anthropic 另有 Claude Security，面向更常规的代码扫描和补丁建议，使用的是公开前沿模型。Mythos Preview 更敏感，仍在受控合作范围里。每个新增组织都要先过 Anthropic 的安全门槛。

这不是产品发布会式的热闹扩张，更像一次带闸门的军备转移：先把高能力模型交到一批可信防守方手里，抢在攻击者拿到类似能力之前，给防守端补一点时间差。

为什么重要：AI 找洞快了，旧安全流程会堵在后半段

传统漏洞处理靠一条慢链路：报告、复现、确认、CVE 协调、补丁发布、企业部署。

这条链路的好处是稳。坏处也明摆着：慢。

过去慢一点还能忍，因为漏洞发现本身也慢。现在 AI 模型把“可疑漏洞发现”的成本往下压，数量往上推，原来的节奏就会出问题。

Anthropic 自己给了一个判断：未来 6 到 12 个月，其他 AI 公司可能也会拥有 Mythos 级别的模型，其中一些模型未必配有足够防滥用机制。

这句话的重点不是 Anthropic 多厉害，而是防守窗口在缩短。

一旦类似能力可以低成本调用，攻击者不需要像过去那样手工慢慢找。他们可以批量筛选目标，批量生成线索，批量撞开那些多年没人管的代码角落。攻击会更频繁，也更难预测。

安全行业过去总说“攻防对抗”。但很多时候，防守方不是输在技术，而是输在流程。攻击者只需要成功一次，防守方要把每个系统、每个依赖、每个下游部署都照顾到。

“兵贵神速”这句老话，在这里很现实。AI 把攻击侧的速度提上去，防守侧如果还在排队走纸面流程，补丁就会变成事后悼词。

谁最受影响：关键基础设施和开源维护者

普通用户短期内不会直接拿到 Mythos，也不需要关心模型参数。真正被推到前台的是两类人。

一类是关键基础设施相关组织。

电力、水务、医疗、通信、硬件供应商，听起来离普通人很远，出事时又离每个人很近。Anthropic 估计，多数合作伙伴若遭遇重大攻击，受影响人数可能超过 1 亿。

这里的风险不是某个 App 崩了，而是供应链、公共服务和基础系统被拖下水。关键基础设施的麻烦在于，它们通常不年轻。代码老，依赖杂，供应商链条长，停机成本高。补丁不是点一下更新按钮，很多时候要排期、测试、验收，还要找人背锅。

另一类是开源维护者。

开源生态对 AI 扫描尤其敏感。一个维护者可能晚上下班后才处理 issue，却突然面对模型批量生成的“高危漏洞报告”。其中有真问题，也会有噪音。谁来复现？谁来判断优先级？谁来和下游沟通？谁来承担修坏的责任？

AI 把报告变多，不等于把维护者变多。

这才是现实成本。模型可以 24 小时扫代码，人不行。维护者的时间、判断力、责任边界，才是开源安全里最稀缺的资源。

我的判断：找洞不是终点，补丁链路才是分水岭

我更在意 Anthropic 没说出口的那半句：超过 1 万个高危或严重漏洞被发现，但修复状态不明。

这不是苛责 Anthropic。发现漏洞本来就只是第一步。真正麻烦的，是确认它是不是漏洞、影响范围多大、应该怎么披露、补丁会不会引入新问题、下游企业什么时候部署。

很多安全事故并不是因为补丁不存在，而是补丁没有进生产系统。更尴尬的是，补丁可能早就发了，企业资产清单却不知道自己用了哪个版本。纸面上安全，现实里裸奔。

所以 Project Glasswing 的价值，不该只按“发现了多少洞”来算。

更该看三件事：

发现的高危漏洞，有多少被人工确认；
确认后的漏洞，如何向维护者和供应链披露；
补丁发布后，有多少真正进入企业生产环境。

如果这三步接不上，AI 找洞越强，越可能制造一座漏洞堆场。看起来满地成果，实际到处积压。

这也是我不太买账某些 AI 安全叙事的地方。行业喜欢展示模型能力，因为那最容易讲故事：发现多少漏洞、击败多少基准、自动生成多少补丁建议。可是安全不是演示视频。安全是工单、审计、责任、变更窗口和凌晨回滚。

模型看着更强，产品反而可能更虚。因为真正的交付不在模型输出，而在组织能不能把输出变成可验证的修复。

Anthropic 这次少见地做对了一件事：没有把 Mythos 级能力直接做成公开产品。

这会牺牲增长速度，也会牺牲一部分商业想象。但在网络安全模型上，克制本身就是能力。刀快一分，鞘也要厚一分。把双用途模型先放进半封闭机制里跑，比拿“开放创新”当挡箭牌要负责任得多。

当然，半封闭也有代价。谁能进合作名单？谁被排除在外？开源项目和小型关键供应商有没有足够资源接入？安全要求会不会变成平台控制权？这些问题都不能靠一句“可信合作方”糊过去。

历史上很多基础设施技术都是这样扩散的。铁路、电力、通信网络，早期都不是单纯的技术问题，而是准入、标准、调度和事故责任问题。今天的 AI 网络安全模型也一样。能力越接近基础设施，治理就越不可能靠厂商自觉。

但眼下先承认一个事实：把 Mythos 级模型关在门里审核扩张，比一键开放给全网更合理。

防守方需要速度差。攻击者也在等同一把刀。

真正的考题已经换了。过去问 AI 能不能发现漏洞。现在要问，谁能把漏洞从模型输出一路送到生产系统的补丁状态。中间每慢一步，都是攻击者的时间红利。

Project Glasswing 的扩容，证明 AI 找洞进入实战。它没有证明 AI 安全已经闭环。

这正是最该警醒的地方：找洞破万只是开场，补丁落地才算交卷。

Anthropic 扩大 Project Glasswing：AI 找洞破万，补丁链路才是真战场

Glasswing扩容

受控扩张

覆盖关键行业

找洞破万

修复不明

瓶颈后移

流程承压

受压对象

基建系统

发生了什么：Glasswing 扩容，但 Mythos 仍被关在门里

为什么重要：AI 找洞快了，旧安全流程会堵在后半段

谁最受影响：关键基础设施和开源维护者

我的判断：找洞不是终点，补丁链路才是分水岭