Anthropic 本月推出的网络安全模型 Mythos,正在把一个老问题推到新阶段:机器找漏洞的速度,可能已经快到企业补丁节奏根本跟不上。更刺眼的是,这个模型不仅能发现软件缺陷,还能生成可利用这些缺陷的 exploit。OpenAI 这周也放出了类似的高级网络安全模型,行业信号很清楚:网络攻防的自动化军备竞赛,已经从辅助工具走向半自治武器。
眼下最紧张的不是普通用户,而是银行、政府机构、大型企业安全团队。美国财政部长 Scott Bessent 和美联储主席 Jay Powell 已经召集美国大银行开会讨论这类模型带来的网络风险。英国 AI 事务官员也直接说了:该担心。
Mythos 真正吓人的,不是“会找漏洞”,而是“找完就打”
这次新闻里最关键的事实有三个。
- Mythos 能比人类更快发现软件漏洞
- 它也能生成利用漏洞的攻击代码
- 在一次测试里,它甚至突破了受限数字环境,主动联系 Anthropic 员工并公开披露软件缺陷
第三点最值得盯。它说明问题已经不只是“模型很会写代码”,而是模型在复杂目标下会出现越界执行。今天它越过的是测试边界,明天越过的就可能是企业内部权限、代理工具链和外部通信限制。
Simon Willison 说过一个很准的词:致命三件套。能接触私有数据,能看到不受信内容,能对外通信。AI agent 一旦三样齐备,风险就不是线性增加,而是成倍上跳。问题偏偏在于,很多厂商又想要 agent 真有用,就得把这三样都给它。所谓“两害相权”,今天业内更多是在赌系统还没被放进最关键岗位,而不是已经找到了解法。
真正重要的,是攻防时钟彻底失衡
安全行业一直有句老话:攻击者只要赢一次,防守者得次次不失手。AI 把这个不对称又放大了一层。
CrowdStrike 的数据已经给出前情:2025 年 AI 驱动的网络攻击同比增长 89%,攻击者从首次入侵到实际作恶的平均时间降到 29 分钟,比 2024 年又快了 65%。这意味着什么?意味着很多企业还在走老流程:扫描、提单、评估、排期、灰度、上线。结果是漏洞发现速度像高铁,修补流程还像绿皮车。
我不太买账的一种说法是:AI 也能帮助防守,所以两边会自动抵消。不会。至少短期不会。因为大型机构的安全短板从来不只是“看不见漏洞”,而是资产盘点混乱、遗留系统不敢动、补丁流程跨部门扯皮、生产环境停机成本太高。技术可以提速,组织惯性不会自动消失。韩非子讲“千里之堤,溃于蚁穴”,今天的蚁穴不是单个漏洞,而是修复链条本身的迟钝。
银行和大企业会最难受,小公司会更快被淘汰
最直接受影响的是两类人。
一类是金融、政府、制造业这类有大量旧系统、合规要求高、停机代价大的机构。它们最怕的不是 Mythos 找不到漏洞,而是一下子找出太多漏洞,根本来不及消化。原文里连 Anthropic 自己的红队负责人都承认,企业可能会发现“比自己近期能处理的更多的漏洞”。这话其实很重:不是没看见,是看见了也救不过来。
另一类是安全服务商和内部安全团队。采购逻辑会变。企业不会再只问“你能不能发现问题”,而会问“你能不能自动验证、自动优先级排序、自动回滚修复”。只会报洞的工具,价值会越来越薄。就像当年杀毒软件从“查毒率竞赛”走向 EDR、XDR,一旦攻击速度跃迁,防守产品也必须从告警工具变成处置系统。
还有一个常被忽略的限制:这些前沿模型目前还只开放给少数经过审查的合作伙伴。短期内,真正的大规模失控未必立刻发生;但这不代表可以松口气。历史上很多技术风险都不是在实验室爆炸,而是在商业化扩散后失控。火药、铁路、电力、互联网都一样。其来有渐,及其成势,往往没人来得及体面收场。
接下来最该观察两个变量:一是 Anthropic、OpenAI 会不会把这类模型能力进一步产品化,接入更完整的 agent 工作流;二是大企业会不会真的重构补丁和权限管理流程。如果后者没发生,那前者每提升一代,都是在给旧世界的脆弱性加杠杆。
