AI安全「攻防不对称」到来:Anthropic Project Glasswing 30天发现超万个高危漏洞,修补速度已追不上发现速度
引言:一个月,一万个漏洞
2026年4月,Anthropic启动了网络安全领域最具野心的项目之一——Project Glasswing,与约50家全球最关键的软件组织合作,用未公开的 Claude Mythos Preview 模型主动扫描安全漏洞。
2026年5月22日,首月战报出炉:
| 维度 |
数据 |
| 合作组织 |
约50家 |
| 上线时间 |
约30天 |
| 发现漏洞总数 |
超10,000个 |
| 漏洞级别 |
高危(High)和关键(Critical) |
| 效率提升 |
部分团队漏洞发现速度 提升10倍 |
| 修补能力 |
许多组织面临「修补速度追不上发现速度」 |
一个月,一万个漏洞,十倍的发现速度——这不是AI安全工具的进步,这是安全范式本身的改变。
一、Project Glasswing:Anthropic的「白帽AI」战略
项目核心架构
| 维度 |
说明 |
| 核心理念 |
在日益强大的AI模型被恶意利用之前,先用它们保护最关键软件 |
| 执行模型 |
Claude Mythos Preview(未公开前沿模型)+ 50家合作组织 |
| 扫描范围 |
全球最关键软件基础设施 |
| 工作模式 |
AI自动扫描 → 人类安全专家验证 → 提交修复 |
| 目标 |
在攻击者(无论是人还是AI)找到漏洞之前,修补它们 |
为什么叫「Glasswing」?
Glasswing(玻璃翼蝴蝶)的翅膀是透明的——寓意是:让软件的漏洞「透明化」,使安全风险无所遁形。
Project Glasswing的本质是:与其等待黑帽用AI攻击,不如先用AI加固防御。 这是「以AI制AI」的安全新范式。
二、10,000个漏洞意味着什么?
数字背后的现实
| 对比维度 |
数字 |
含义 |
| 30天内发现漏洞 |
10,000+ |
平均每天333+个高危漏洞 |
| 每月10,000个 vs 传统渗透测试 |
传统团队年产出数十到数百 |
AI速度是人类的100-1000倍 |
| 部分团队速度提升 |
10倍 |
同一安全团队,加上AI → 产出暴增10倍 |
| 修补能力 |
追不上发现速度 |
发现速度 ≠ 修补速度,形成「漏洞积压」 |
漏洞积压:一个新的安全问题
发现速度(AI驱动) 修补速度(人类为主)
│ │
────┼──── │
────┼──── │
────┼──── │
────┼──── │ ← 这个差距在拉大
────┼──── │
────┼──── ─────┼────
────┼──── ─────┼────
│ │
爆发式增长 线性增长
这是一个全新问题:以前是「找不到漏洞」,现在是「找到了但修不完」。 安全团队的瓶颈从「发现」转移到了「修复」。
三、Claude Mythos Preview:未公开的「安全天赋」
模型能力推测
| 可能能力 |
说明 |
| 代码深度理解 |
跨文件、跨模块分析代码逻辑 |
| 漏洞模式识别 |
在海量代码中识别安全缺陷模式 |
| 攻击链推演 |
组合多个低级漏洞 → 推演到关键级别攻击路径 |
| 上下文保持 |
分析数百万行代码时保持连贯性 |
为什么Anthropic没有公开这个模型?
| 原因 |
说明 |
| 安全风险 |
如此强大的漏洞发现能力若落入黑帽之手,后果不堪设想 |
| 受控使用 |
仅限受信合作伙伴在受控环境中使用 |
| 渐进公开 |
可能作为AI安全能力管控的「实验田」 |
Claude Mythos Preview的能力暗示了一个更根本的问题:当一个AI模型既能「写代码」又能「找漏洞」时,我们该如何安全地部署它?
四、从「对称攻防」到「不对称攻防」
传统安全模型
| 阶段 |
攻击方 |
防御方 |
对称性 |
| 过去 |
黑客团队 |
安全团队 |
大致对称(都是人类) |
| 现在 |
AI辅助黑客 |
AI辅助安全 |
大致对称(都是AI辅助) |
| 未来 |
全自动AI攻击 |
人类修补 |
彻底不对称 |
不对称的三个维度
| 维度 |
攻击方(AI) |
防御方(人类) |
差距 |
| 速度 |
毫秒级扫描 |
天级别修复 |
数量级差距 |
| 覆盖面 |
全代码库无死角 |
受限于人力 |
无限 vs 有限 |
| 持续性 |
24/7不间断 |
工作时间有限 |
3倍时间差 |
谁是更大的威胁?
| 威胁来源 |
动机 |
技术水平 |
当前风险 |
| 国家级APT |
地缘政治 |
高 |
已有AI能力 |
| 犯罪组织 |
金钱 |
中高 |
快速采纳AI |
| 「脚本小子」 |
好奇/破坏 |
低 |
AI降低了门槛 |
| 失控AI |
N/A |
未知 |
远期风险 |
「攻防不对称」的核心不是AI变强了——而是攻击可以被无限加速,但防御(尤其修补)严重依赖人类判断和流程。
五、Anthropic的安全战略:从闭源到「安全基础设施」
Anthropic的「三层安全体系」
| 层次 |
产品/项目 |
定位 |
| L1 - 模型安全 |
Constitutional AI + RLHF |
让模型本身「安全」 |
| L2 - 主动防御 |
Project Glasswing |
用AI保护他人的软件 |
| L3 - 安全生态 |
与政府/企业合作 |
建立AI安全的行业标准 |
与竞争对手的对比
| 公司 |
AI安全策略 |
特点 |
| Anthropic |
Project Glasswing + Constitutional AI |
「安全第一」,白帽AI先驱 |
| OpenAI |
Daybreak平台(5月发布) |
后发跟进,商业化导向 |
| Google |
安全AI + Mandiant |
并购整合路线 |
| 微软 |
Security Copilot |
产品化路线 |
Anthropic正在用Project Glasswing建立一个新的竞争壁垒:不只是「最安全的AI」,而是「最能保护世界的AI」。 这既是商业策略,也是价值观声明。
六、行业连锁反应
1. 安全行业面临重构
| 影响 |
说明 |
| 渗透测试自动化 |
传统渗透测试团队的「手工漏洞挖掘」将被AI取代 |
| 漏洞赏金模式变化 |
AI发现海量漏洞 → 赏金平台需要重新定价 |
| 修补成为新瓶颈 |
安全公司的价值从「发现问题」转向「快速修复」 |
| 安全人才需求变化 |
从「漏洞猎人」转向「AI安全运营专家」 |
2. 企业软件供应链安全
| 影响 |
说明 |
| 开源软件压力 |
开源项目维护者将面对「AI驱动的海量漏洞报告」 |
| SBOM价值凸显 |
软件物料清单(SBOM)成为漏洞定位的前提 |
| 自动化修复 |
从AI辅助发现 → AI辅助修复的闭环需求被激发 |
3. 监管层面的新课题
| 问题 |
说明 |
| AI安全能力管控 |
如果AI能发现10,000个漏洞——谁能合法使用这种能力? |
| 漏洞披露规则 |
AI发现的漏洞应该多快披露?什么级别的漏洞必须上报? |
| 责任归属 |
如果AI发现了漏洞但没及时修补导致被攻击——谁负责? |
七、趋势预测
| 时间 |
预测 |
| 2026年下半年 |
至少3家主流AI公司推出类似Project Glasswing的安全项目 |
| 2026年底 |
AI发现的漏洞数量突破10万级别 |
| 2027年 |
首个「AI发现漏洞→AI自动生成补丁→AI验证修复」的全自动闭环出现 |
| 2027年 |
「AI安全审计」成为企业软件发布的标配流程 |
| 2028年 |
全球主要软件安全隐患数量因AI发现而先升后降——先暴增(发现),后回落(修复) |
八、总结
Anthropic Project Glasswing的首月战报,不只是一个数字:
| 维度 |
含义 |
| 10,000个漏洞 |
AI的安全能力已超越人类数个数量级 |
| 30天达到这规模 |
传统安全团队的年度产出,AI一个月完成 |
| 10倍发现速度 |
AI不是辅助,是「倍增器」 |
| 修补追不上发现 |
下一个瓶颈是「修复」,不是「发现」 |
Project Glasswing最深刻的启示:AI安全竞赛的本质不是「谁有更强的AI」,而是「谁能更快地从发现问题走到解决问题」。 在AI能一秒钟发现100个漏洞的时代——真正的安全能力不是「找到更多漏洞」,而是「更快地修补它们」。
对于安全从业者:护城河不再是「发现漏洞的嗅觉」,而是「运用AI工具发现+修复+验证的全流程能力」。 对于企业CTO:如果你还没接入AI安全审计——你的竞争对手可能正在用AI扫描你的软件。 对于所有开发者:写代码时多想想安全问题——因为AI很快就会来检查你的代码了。
本文基于Anthropic官方Project Glasswing公告(2026年5月22日)、IT之家、知乎、The AI Track、LetsDataScience等多家来源综合分析。发布时间:2026年5月25日