危险！Anthropic自曝：Mythos已把「N天漏洞」压

互联网 0 20

新智元 互联网资讯 发布于 07:15

本条新闻为单纯事实消息的时事新闻，转载自新智元，版权归源站所有，如有侵权，烦请联系我们。

新智元报道

【新智元导读】Anthropic红队负责人发文称：Mythos已把「N天漏洞」压缩成N小时。仅需数小时与几千美元，系统安全补丁竟被AI逆向成致命攻击武器，传统网络防线瞬间崩塌了！

就在刚刚，Anthorpic又抛出一个轰动整个网络安全界的消息。

红队负责人Logan Graham在X上正式宣布：Claude Mythos Preview在自动化开发「N日漏洞」方面取得了突破性飞跃。

以前，漏洞武器化需要顶级黑客耗费数周；而在Mythos面前，这个时间被无情地压缩到了几个小时，成本仅需数千美元！

网络安全，正在从「N日威胁」变成令人窒息的「N小时威胁」。

想象一下，微软或者火狐刚刚发布了一个安全补丁，你的电脑还没来得及重启更新。

就在这短短几个小时里，一个躲在暗处的AI，已经通过分析这个补丁，逆向推导出致命的漏洞攻击武器，并成功获取了你电脑系统的最高控制权。

这就是人类现在要面对的现实。

补丁，居然成为黑客的藏宝图

首先，我们要了解一个网安界的基础博弈：零日漏洞（Zero-day）与 N日漏洞（N-day）。

过去几个月里，科技媒体的聚光灯大多在AI寻找「零日漏洞」的能力上。

零日漏洞，是一种软件开发者尚不知晓的漏洞。

然而事实上，现实世界中绝大多数的破坏，都源于「N日漏洞」，也就是那些已经公开披露，甚至已经发布了补丁，但尚未在所有设备上完成修复的漏洞。

从某种意义上说，N日漏洞比零日漏洞更危险。

原因就在于，补丁本身就是一张通往漏洞的藏宝图。

在黑客圈，这被称为「补丁比对」。

当软件供应商发布安全更新时，攻击者会立刻下载新旧版本的源代码或二进制文件进行对比。

通过找出「代码改了哪里」，他们就能精准定位原本存在的安全缺陷，并逆向工程出漏洞的触发机制。

因为逆向过程所需的专家级技术极度稀缺，这就为防守方争取了宝贵的窗口期，让他们有时间把更新推送到全球设备上。

2017年，震惊全球的WannaCry勒索软件，是在微软发布MS17-010补丁后的第59天才爆发的。

2023年的Citrix Bleed漏洞，公开的漏洞利用代码花费了大约两周时间才出现。

根据Mandiant在2020年的分析，在25个重大漏洞中，有16个需要一个月或更长时间才能被武器化。

然而，随着Mythos Preview的入局，这个曾经保护着全球千万企业的「时间壁垒」，轰然倒塌了！

火狐浏览器沦陷，被AI无情碾压

为了测试大模型究竟能把「N日漏洞」的开发提升到什么程度，Winnie Xiao, Tim Abbott等Anthropic的研究员们首先选择了Mozilla的Firefox浏览器。

为什么选火狐？因为它是防守方的「最佳防守范例」。

火狐会自动在后台下载修复程序，用户只需重启浏览器即可完成更新。Mozilla甚至将小版本的更新频率从每月缩短到了每周。

在Anthropic研究的补丁中，漏洞从中位数的发布到修复仅有19天——在企业界，这已经是「光速」了。

但Mythos Preview用实力证明：在绝对的AI算力面前，19天太长了！

实验设定：极其苛刻的沙盒环境

研究团队选择了火狐148和149版本中的18个SpiderMonkey安全补丁。这些火狐的JavaScript引擎，是现实中浏览器漏洞利用最常见的入口。

这些漏洞在源代码库中已公开至少90天。

各种大模型被关在一个Linux容器里，没有互联网连接，只有命令行、文本编辑器、补丁的公开差异代码（去除了测试代码），以及漏洞修复前后的两个构建版本。

它拿不到任何漏洞建议文本或重现代码。

可以说就是「开局一张图，内容全靠编」，完全是地狱难度。

第一关：让系统崩溃（PoC开发）

第一步是开发「概念验证」。模型需要写出一段代码，证明它能精准触发这个漏洞导致系统崩溃，而不是因为其他随机原因崩溃。

测试结果令人咋舌：研究团队对比了从Opus 4.5到Opus 4.8，再到Mythos Preview的进化曲线。

旧模型Opus 4.5和4.8的成功率在2到11个之间。

Mythos Preview在18个漏洞中，成功搞定了14个！

它的速度更是降维打击： Mythos Preview产出第一个有效PoC只用了12分钟！

在40分钟内，它就产出了13个PoC，耗时仅为Opus 4.8完成11个PoC的一半。完成所有14个PoC的总时间，仅仅只有大约3个小时。

在稳定性测试中，Mythos Preview有7个漏洞达到了100%的成功率，而Opus 4.6和4.8只有1个漏洞能做到。

第二关：致命的完全利用

仅仅让浏览器崩溃是不够的，真正的黑客需要的是「执行任意代码」。

在这一关，模型必须利用崩溃，绕过沙盒，去读取一个系统深处、原本绝对无法访问的随机机密文件。

这正是Mythos Preview真正展现出「怪物级」潜力的地方。

Opus 4.8 勉强做出了 2 个。

Opus 4.6 和 Sonnet 4.6 各做出 1 个。

Mythos Preview？它自主开发出了 8 个完全可用的远程代码执行漏洞！

第一个完全可用的漏洞武器，它只用了不到1个小时就写出来了。完成全部8个，总耗时约12小时。

对比一下人类的节奏：Mozilla发布补丁后的1个小时内，AI已经做出了可以直接攻击未升级用户的武器，而此时距离修复版火狐148正式推送到用户手中，还有漫长的18天！

微软内核防御崩溃

从蓝屏到系统霸主

如果说攻破开源的火狐浏览器还算是有迹可循（毕竟有源代码可以对比），那么接下来Mythos Preview对微软Windows操作系统的攻击，则堪称网络安全史上的「恐怖故事」。

闭源软件没有源代码。

攻击者只能面对晦涩难懂的编译后二进制文件，所有对人类有用的变量名、类型、数据结构统统被抹除了。

实验设定——无源闭源的极致挑战

研究团队选取了2026年1月至2月期间的21个Windows内核漏洞，全部超出了测试模型的知识截止日期）。

这些都是本地提权漏洞——黑客利用它们可以将一个普通低权限用户，直接提升为拥有系统生杀大权的「SYSTEM」最高权限。

Agent要面对的，是一台运行着易受攻击版本的Windows Server 2025虚拟机。它被剥夺了网络访问权限，身份只是一个低权限用户。

它拥有的工具只有：

漏洞修复前后的二进制文件

公开的调试符号（仅映射函数名和地址）

通过Ghidra反编译出来的伪代码

通过Ghidriff生成的函数级差异对比

微软官方极其简短的漏洞通告

面对这堆如同天书的二进制文件，AI的表现如何？

在触发蓝屏死机（BSOD）上， Sonnet 4.6和Opus 4.7成功触发了13个，Opus 4.8触发了15个。而Mythos Preview成功触发了18个。

它不仅找得准，而且快得离谱：第一个PoC仅用31分钟就宣告完成，所有18个全部在6小时内搞定。

这6小时的API调用成本，仅为2200美元。

而终极挑战，还是全链条提权。

这个过程中真正的挑战在于，不仅要触发漏洞，还要把各种底层机制串联起来，绕过Windows内核层层叠叠的防御缓解措施（如KASLR等），最终完成身份跃迁。

在这一关，Opus 4.8在多次尝试后折戟沉沙。它找到了任意读写和KASLR泄露的方法，但无法将其连成一条完整的利用链。

而Mythos Preview孤军奋战，最终单枪匹马产出了 8 款不同的、顶级的内核提权漏洞利用链！

这8个顶级内核武器的API总成本仅为15700美元，平均每个漏洞的研发成本不到2000美元。

微软的「漏洞评级」成了笑话？

在这21个漏洞中，微软官方安全通告将其中14个评估为「不太可能被利用」或「较少可能被利用」。

然而，Mythos Preview啪啪打脸：它成功为其中13个生成了PoC，甚至将一个被官方评为「不太可能被利用」的漏洞，硬生生写出了完整的提权利用链！

微软的评级系统是基于「人类安全研究员」的能力来校准的。

然而现在，Mythos已经把人类世界的常识颠覆了！

Anthropic红队负责人Logan Graham公布这一消息时，业界立刻震撼了。

在评论区，安全专家Gabrie惊呼「这太疯狂了」，并敏锐地询问图表的X轴是否可以按「Token消耗量」来展示。

对此，Logan回复说：「我们关注时间，因为人们最关心的是：一个未打补丁的系统在面对从补丁推导出的N日漏洞时，会有多长时间的脆弱期……漏洞越早被发现，风险就越大。」

网友Jj McMc则一针见血地指出：「如果X轴是时间而不是Token，这意味着Mythos即使生成速度可能更慢，但实际上它的Token效率高得离谱。」

数据分析师Rameswar感慨道：「图表显示出了明显的断层差距。Mythos在真实Windows内核CVE上的速度和复现总数都遥遥领先，这是我们见过的最具体的AI智能体能力跃升之一。」

传统安全防线，全面崩塌

现在，开发的瓶颈仅仅变成了几千美元和API的访问权限。

一个毫无逆向工程经验的攻击者，只需要点点鼠标，调用AI API，就能在一个下午把整个月积累的几十个补丁，全部转化为致命的攻击武器。

「N日漏洞」这个词更是已经out了。现在的真实情况是：「N小时漏洞」。

谁会是这场变革中最惨的受害者？首当其冲的是那些更新缓慢、难以打补丁的系统，比如工业控制系统、医疗设备、物联网设备等。

面对令人绝望的「N小时」威胁，人类还有救吗？

Anthropic的博客在最后给出了防守方的破局之道：仅仅加快补丁部署已经不够了，防守必须从源头抓起。

迁移到内存安全语言：这是最釜底抽薪的一招。将关键的底层组件从C/C++迁移到Rust等内存安全语言。因为无论是火狐还是Windows内核，绝大多数极其危险的代码执行和提权漏洞，都源于内存管理错误。

硬件与底层缓解措施：采用控制流保护、硬件影子堆栈等技术，一次性退役掉整个类别的漏洞利用方式。

缩短空窗期：像Mozilla一样，将补丁的发布节奏从按月缩短为按周，甚至实时热修复。

2026年的夏天，Mythos Preview向世界宣告了网络安全旧纪元的终结。

正如Logan所说，一年后回头看，今天令我们震惊的Mythos或许只如儿戏。

但正是因为有了今天的预警，人类的防御网才不至于在未来的AI黑客面前溃不成军。

参考资料：

https://x.com/logangraham/status/2064220844168253500

编辑：Aeneas

点赞 0 收藏(0)

0个评论

消灭零评论