
新智元报道

【新智元导读】Anthropic红队负责人发文称:Mythos已把「N天漏洞」压缩成N小时。仅需数小时与几千美元,系统安全补丁竟被AI逆向成致命攻击武器,传统网络防线瞬间崩塌了!
就在刚刚,Anthorpic又抛出一个轰动整个网络安全界的消息。
红队负责人Logan Graham在X上正式宣布:Claude Mythos Preview在自动化开发「N日漏洞」方面取得了突破性飞跃。
以前,漏洞武器化需要顶级黑客耗费数周;而在Mythos面前,这个时间被无情地压缩到了几个小时,成本仅需数千美元!

网络安全,正在从「N日威胁」变成令人窒息的「N小时威胁」。
想象一下,微软或者火狐刚刚发布了一个安全补丁,你的电脑还没来得及重启更新。
就在这短短几个小时里,一个躲在暗处的AI,已经通过分析这个补丁,逆向推导出致命的漏洞攻击武器,并成功获取了你电脑系统的最高控制权。

这就是人类现在要面对的现实。

补丁,居然成为黑客的藏宝图
首先,我们要了解一个网安界的基础博弈:零日漏洞(Zero-day)与 N日漏洞(N-day)。
过去几个月里,科技媒体的聚光灯大多在AI寻找「零日漏洞」的能力上。
零日漏洞,是一种软件开发者尚不知晓的漏洞。
然而事实上,现实世界中绝大多数的破坏,都源于「N日漏洞」,也就是那些已经公开披露,甚至已经发布了补丁,但尚未在所有设备上完成修复的漏洞。
从某种意义上说,N日漏洞比零日漏洞更危险。
原因就在于,补丁本身就是一张通往漏洞的藏宝图。
在黑客圈,这被称为「补丁比对」。
当软件供应商发布安全更新时,攻击者会立刻下载新旧版本的源代码或二进制文件进行对比。
通过找出「代码改了哪里」,他们就能精准定位原本存在的安全缺陷,并逆向工程出漏洞的触发机制。
因为逆向过程所需的专家级技术极度稀缺,这就为防守方争取了宝贵的窗口期,让他们有时间把更新推送到全球设备上。
2017年,震惊全球的WannaCry勒索软件,是在微软发布MS17-010补丁后的第59天才爆发的。
2023年的Citrix Bleed漏洞,公开的漏洞利用代码花费了大约两周时间才出现。
根据Mandiant在2020年的分析,在25个重大漏洞中,有16个需要一个月或更长时间才能被武器化。
然而,随着Mythos Preview的入局,这个曾经保护着全球千万企业的「时间壁垒」,轰然倒塌了!
火狐浏览器沦陷,被AI无情碾压
为了测试大模型究竟能把「N日漏洞」的开发提升到什么程度,Winnie Xiao, Tim Abbott等Anthropic的研究员们首先选择了Mozilla的Firefox浏览器。
为什么选火狐?因为它是防守方的「最佳防守范例」。

火狐会自动在后台下载修复程序,用户只需重启浏览器即可完成更新。Mozilla甚至将小版本的更新频率从每月缩短到了每周。
在Anthropic研究的补丁中,漏洞从中位数的发布到修复仅有19天——在企业界,这已经是「光速」了。
但Mythos Preview用实力证明:在绝对的AI算力面前,19天太长了!

实验设定:极其苛刻的沙盒环境
研究团队选择了火狐148和149版本中的18个SpiderMonkey安全补丁。这些火狐的JavaScript引擎,是现实中浏览器漏洞利用最常见的入口。
这些漏洞在源代码库中已公开至少90天。
各种大模型被关在一个Linux容器里,没有互联网连接,只有命令行、文本编辑器、补丁的公开差异代码(去除了测试代码),以及漏洞修复前后的两个构建版本。
它拿不到任何漏洞建议文本或重现代码。
可以说就是「开局一张图,内容全靠编」,完全是地狱难度。
第一关:让系统崩溃(PoC开发)
第一步是开发「概念验证」。模型需要写出一段代码,证明它能精准触发这个漏洞导致系统崩溃,而不是因为其他随机原因崩溃。
测试结果令人咋舌: 研究团队对比了从Opus 4.5到Opus 4.8,再到Mythos Preview的进化曲线。

旧模型Opus 4.5和4.8的成功率在2到11个之间。
Mythos Preview在18个漏洞中,成功搞定了14个!
它的速度更是降维打击: Mythos Preview产出第一个有效PoC只用了12分钟!
在40分钟内,它就产出了13个PoC,耗时仅为Opus 4.8完成11个PoC的一半。完成所有14个PoC的总时间,仅仅只有大约3个小时。
在稳定性测试中,Mythos Preview有7个漏洞达到了100%的成功率,而Opus 4.6和4.8只有1个漏洞能做到。
第二关:致命的完全利用
仅仅让浏览器崩溃是不够的,真正的黑客需要的是「执行任意代码」。
在这一关,模型必须利用崩溃,绕过沙盒,去读取一个系统深处、原本绝对无法访问的随机机密文件。
这正是Mythos Preview真正展现出「怪物级」潜力的地方。

Opus 4.8 勉强做出了 2 个。
Opus 4.6 和 Sonnet 4.6 各做出 1 个。
Mythos Preview?它自主开发出了 8 个完全可用的远程代码执行漏洞!
第一个完全可用的漏洞武器,它只用了不到1个小时就写出来了。完成全部8个,总耗时约12小时。
对比一下人类的节奏:Mozilla发布补丁后的1个小时内,AI已经做出了可以直接攻击未升级用户的武器,而此时距离修复版火狐148正式推送到用户手中,还有漫长的18天!

微软内核防御崩溃
从蓝屏到系统霸主
如果说攻破开源的火狐浏览器还算是有迹可循(毕竟有源代码可以对比),那么接下来Mythos Preview对微软Windows操作系统的攻击,则堪称网络安全史上的「恐怖故事」。
闭源软件没有源代码。
攻击者只能面对晦涩难懂的编译后二进制文件,所有对人类有用的变量名、类型、数据结构统统被抹除了。

实验设定——无源闭源的极致挑战
研究团队选取了2026年1月至2月期间的21个Windows内核漏洞,全部超出了测试模型的知识截止日期)。
这些都是本地提权漏洞——黑客利用它们可以将一个普通低权限用户,直接提升为拥有系统生杀大权的「SYSTEM」最高权限。
Agent要面对的,是一台运行着易受攻击版本的Windows Server 2025虚拟机。它被剥夺了网络访问权限,身份只是一个低权限用户。
它拥有的工具只有:
漏洞修复前后的二进制文件
公开的调试符号(仅映射函数名和地址)
通过Ghidra反编译出来的伪代码
通过Ghidriff生成的函数级差异对比
微软官方极其简短的漏洞通告
面对这堆如同天书的二进制文件,AI的表现如何?
在触发蓝屏死机(BSOD)上, Sonnet 4.6和Opus 4.7成功触发了13个,Opus 4.8触发了15个。而Mythos Preview成功触发了18个。
它不仅找得准,而且快得离谱:第一个PoC仅用31分钟就宣告完成,所有18个全部在6小时内搞定。
这6小时的API调用成本,仅为2200美元。

而终极挑战,还是全链条提权。
这个过程中真正的挑战在于,不仅要触发漏洞,还要把各种底层机制串联起来,绕过Windows内核层层叠叠的防御缓解措施(如KASLR等),最终完成身份跃迁。
在这一关,Opus 4.8在多次尝试后折戟沉沙。它找到了任意读写和KASLR泄露的方法,但无法将其连成一条完整的利用链。
而Mythos Preview孤军奋战,最终单枪匹马产出了 8 款不同的、顶级的内核提权漏洞利用链!
这8个顶级内核武器的API总成本仅为15700美元,平均每个漏洞的研发成本不到2000美元。

微软的「漏洞评级」成了笑话?
在这21个漏洞中,微软官方安全通告将其中14个评估为「不太可能被利用」或「较少可能被利用」。
然而,Mythos Preview啪啪打脸:它成功为其中13个生成了PoC,甚至将一个被官方评为「不太可能被利用」的漏洞,硬生生写出了完整的提权利用链!
微软的评级系统是基于「人类安全研究员」的能力来校准的。
然而现在,Mythos已经把人类世界的常识颠覆了!
Anthropic红队负责人Logan Graham公布这一消息时,业界立刻震撼了。
在评论区,安全专家Gabrie惊呼「这太疯狂了」,并敏锐地询问图表的X轴是否可以按「Token消耗量」来展示。
对此,Logan回复说:「我们关注时间,因为人们最关心的是:一个未打补丁的系统在面对从补丁推导出的N日漏洞时,会有多长时间的脆弱期……漏洞越早被发现,风险就越大。」

网友Jj McMc则一针见血地指出:「如果X轴是时间而不是Token,这意味着Mythos即使生成速度可能更慢,但实际上它的Token效率高得离谱。」

数据分析师Rameswar感慨道:「图表显示出了明显的断层差距。Mythos在真实Windows内核CVE上的速度和复现总数都遥遥领先,这是我们见过的最具体的AI智能体能力跃升之一。」
传统安全防线,全面崩塌
现在,开发的瓶颈仅仅变成了几千美元和API的访问权限。
一个毫无逆向工程经验的攻击者,只需要点点鼠标,调用AI API,就能在一个下午把整个月积累的几十个补丁,全部转化为致命的攻击武器。
「N日漏洞」这个词更是已经out了。现在的真实情况是:「N小时漏洞」。

谁会是这场变革中最惨的受害者? 首当其冲的是那些更新缓慢、难以打补丁的系统,比如工业控制系统、医疗设备、物联网设备等。
面对令人绝望的「N小时」威胁,人类还有救吗?
Anthropic的博客在最后给出了防守方的破局之道:仅仅加快补丁部署已经不够了,防守必须从源头抓起。
迁移到内存安全语言:这是最釜底抽薪的一招。将关键的底层组件从C/C++迁移到Rust等内存安全语言。因为无论是火狐还是Windows内核,绝大多数极其危险的代码执行和提权漏洞,都源于内存管理错误。
硬件与底层缓解措施:采用控制流保护、硬件影子堆栈等技术,一次性退役掉整个类别的漏洞利用方式。
缩短空窗期:像Mozilla一样,将补丁的发布节奏从按月缩短为按周,甚至实时热修复。
2026年的夏天,Mythos Preview向世界宣告了网络安全旧纪元的终结。
正如Logan所说,一年后回头看,今天令我们震惊的Mythos或许只如儿戏。
但正是因为有了今天的预警,人类的防御网才不至于在未来的AI黑客面前溃不成军。
参考资料:
https://x.com/logangraham/status/2064220844168253500
编辑:Aeneas