危险!Anthropic自曝:Mythos已把「N天漏洞」压

互联网 0 20
互联网资讯
本条新闻为单纯事实消息的时事新闻,转载自新智元,版权归源站所有,如有侵权,烦请联系我们


新智元报道


【新智元导读】Anthropic红队负责人发文称:Mythos已把「N天漏洞」压缩成N小时。仅需数小时与几千美元,系统安全补丁竟被AI逆向成致命攻击武器,传统网络防线瞬间崩塌了!

就在刚刚,Anthorpic又抛出一个轰动整个网络安全界的消息。

红队负责人Logan Graham在X上正式宣布:Claude Mythos Preview在自动化开发「N日漏洞」方面取得了突破性飞跃。

以前,漏洞武器化需要顶级黑客耗费数周;而在Mythos面前,这个时间被无情地压缩到了几个小时,成本仅需数千美元!


网络安全,正在从「N日威胁」变成令人窒息的「N小时威胁」。

想象一下,微软或者火狐刚刚发布了一个安全补丁,你的电脑还没来得及重启更新。

就在这短短几个小时里,一个躲在暗处的AI,已经通过分析这个补丁,逆向推导出致命的漏洞攻击武器,并成功获取了你电脑系统的最高控制权。


这就是人类现在要面对的现实。


补丁,居然成为黑客的藏宝图

首先,我们要了解一个网安界的基础博弈:零日漏洞(Zero-day)与 N日漏洞(N-day)。

过去几个月里,科技媒体的聚光灯大多在AI寻找「零日漏洞」的能力上。

零日漏洞,是一种软件开发者尚不知晓的漏洞。

然而事实上,现实世界中绝大多数的破坏,都源于「N日漏洞」,也就是那些已经公开披露,甚至已经发布了补丁,但尚未在所有设备上完成修复的漏洞。

从某种意义上说,N日漏洞比零日漏洞更危险。

原因就在于,补丁本身就是一张通往漏洞的藏宝图。

在黑客圈,这被称为「补丁比对」。

当软件供应商发布安全更新时,攻击者会立刻下载新旧版本的源代码或二进制文件进行对比。

通过找出「代码改了哪里」,他们就能精准定位原本存在的安全缺陷,并逆向工程出漏洞的触发机制。

因为逆向过程所需的专家级技术极度稀缺,这就为防守方争取了宝贵的窗口期,让他们有时间把更新推送到全球设备上。

2017年,震惊全球的WannaCry勒索软件,是在微软发布MS17-010补丁后的第59天才爆发的。

2023年的Citrix Bleed漏洞,公开的漏洞利用代码花费了大约两周时间才出现。

根据Mandiant在2020年的分析,在25个重大漏洞中,有16个需要一个月或更长时间才能被武器化。

然而,随着Mythos Preview的入局,这个曾经保护着全球千万企业的「时间壁垒」,轰然倒塌了!

火狐浏览器沦陷,被AI无情碾压

为了测试大模型究竟能把「N日漏洞」的开发提升到什么程度,Winnie Xiao, Tim Abbott等Anthropic的研究员们首先选择了Mozilla的Firefox浏览器。

为什么选火狐?因为它是防守方的「最佳防守范例」。


火狐会自动在后台下载修复程序,用户只需重启浏览器即可完成更新。Mozilla甚至将小版本的更新频率从每月缩短到了每周。

在Anthropic研究的补丁中,漏洞从中位数的发布到修复仅有19天——在企业界,这已经是「光速」了。

但Mythos Preview用实力证明:在绝对的AI算力面前,19天太长了!


实验设定:极其苛刻的沙盒环境

研究团队选择了火狐148和149版本中的18个SpiderMonkey安全补丁。这些火狐的JavaScript引擎,是现实中浏览器漏洞利用最常见的入口。

这些漏洞在源代码库中已公开至少90天。

各种大模型被关在一个Linux容器里,没有互联网连接,只有命令行、文本编辑器、补丁的公开差异代码(去除了测试代码),以及漏洞修复前后的两个构建版本。

它拿不到任何漏洞建议文本或重现代码。

可以说就是「开局一张图,内容全靠编」,完全是地狱难度。

第一关:让系统崩溃(PoC开发)

第一步是开发「概念验证」。模型需要写出一段代码,证明它能精准触发这个漏洞导致系统崩溃,而不是因为其他随机原因崩溃。

测试结果令人咋舌: 研究团队对比了从Opus 4.5到Opus 4.8,再到Mythos Preview的进化曲线。


旧模型Opus 4.5和4.8的成功率在2到11个之间。

Mythos Preview在18个漏洞中,成功搞定了14个!

它的速度更是降维打击: Mythos Preview产出第一个有效PoC只用了12分钟!

在40分钟内,它就产出了13个PoC,耗时仅为Opus 4.8完成11个PoC的一半。完成所有14个PoC的总时间,仅仅只有大约3个小时。

在稳定性测试中,Mythos Preview有7个漏洞达到了100%的成功率,而Opus 4.6和4.8只有1个漏洞能做到。

第二关:致命的完全利用

仅仅让浏览器崩溃是不够的,真正的黑客需要的是「执行任意代码」。

在这一关,模型必须利用崩溃,绕过沙盒,去读取一个系统深处、原本绝对无法访问的随机机密文件。

这正是Mythos Preview真正展现出「怪物级」潜力的地方。


Opus 4.8 勉强做出了 2 个。

Opus 4.6 和 Sonnet 4.6 各做出 1 个。

Mythos Preview?它自主开发出了 8 个完全可用的远程代码执行漏洞!

第一个完全可用的漏洞武器,它只用了不到1个小时就写出来了。完成全部8个,总耗时约12小时。

对比一下人类的节奏:Mozilla发布补丁后的1个小时内,AI已经做出了可以直接攻击未升级用户的武器,而此时距离修复版火狐148正式推送到用户手中,还有漫长的18天!


微软内核防御崩溃

从蓝屏到系统霸主

如果说攻破开源的火狐浏览器还算是有迹可循(毕竟有源代码可以对比),那么接下来Mythos Preview对微软Windows操作系统的攻击,则堪称网络安全史上的「恐怖故事」。

闭源软件没有源代码。

攻击者只能面对晦涩难懂的编译后二进制文件,所有对人类有用的变量名、类型、数据结构统统被抹除了。


实验设定——无源闭源的极致挑战

研究团队选取了2026年1月至2月期间的21个Windows内核漏洞,全部超出了测试模型的知识截止日期)。

这些都是本地提权漏洞——黑客利用它们可以将一个普通低权限用户,直接提升为拥有系统生杀大权的「SYSTEM」最高权限。

Agent要面对的,是一台运行着易受攻击版本的Windows Server 2025虚拟机。它被剥夺了网络访问权限,身份只是一个低权限用户。

它拥有的工具只有:

漏洞修复前后的二进制文件

公开的调试符号(仅映射函数名和地址)

通过Ghidra反编译出来的伪代码

通过Ghidriff生成的函数级差异对比

微软官方极其简短的漏洞通告

面对这堆如同天书的二进制文件,AI的表现如何?

在触发蓝屏死机(BSOD)上, Sonnet 4.6和Opus 4.7成功触发了13个,Opus 4.8触发了15个。而Mythos Preview成功触发了18个。

它不仅找得准,而且快得离谱:第一个PoC仅用31分钟就宣告完成,所有18个全部在6小时内搞定。

这6小时的API调用成本,仅为2200美元。


而终极挑战,还是全链条提权。

这个过程中真正的挑战在于,不仅要触发漏洞,还要把各种底层机制串联起来,绕过Windows内核层层叠叠的防御缓解措施(如KASLR等),最终完成身份跃迁。

在这一关,Opus 4.8在多次尝试后折戟沉沙。它找到了任意读写和KASLR泄露的方法,但无法将其连成一条完整的利用链。

而Mythos Preview孤军奋战,最终单枪匹马产出了 8 款不同的、顶级的内核提权漏洞利用链!

这8个顶级内核武器的API总成本仅为15700美元,平均每个漏洞的研发成本不到2000美元。


微软的「漏洞评级」成了笑话?

在这21个漏洞中,微软官方安全通告将其中14个评估为「不太可能被利用」或「较少可能被利用」。

然而,Mythos Preview啪啪打脸:它成功为其中13个生成了PoC,甚至将一个被官方评为「不太可能被利用」的漏洞,硬生生写出了完整的提权利用链!

微软的评级系统是基于「人类安全研究员」的能力来校准的。

然而现在,Mythos已经把人类世界的常识颠覆了!

Anthropic红队负责人Logan Graham公布这一消息时,业界立刻震撼了。

在评论区,安全专家Gabrie惊呼「这太疯狂了」,并敏锐地询问图表的X轴是否可以按「Token消耗量」来展示。

对此,Logan回复说:「我们关注时间,因为人们最关心的是:一个未打补丁的系统在面对从补丁推导出的N日漏洞时,会有多长时间的脆弱期……漏洞越早被发现,风险就越大。」


网友Jj McMc则一针见血地指出:「如果X轴是时间而不是Token,这意味着Mythos即使生成速度可能更慢,但实际上它的Token效率高得离谱。」


数据分析师Rameswar感慨道:「图表显示出了明显的断层差距。Mythos在真实Windows内核CVE上的速度和复现总数都遥遥领先,这是我们见过的最具体的AI智能体能力跃升之一。」

传统安全防线,全面崩塌

现在,开发的瓶颈仅仅变成了几千美元和API的访问权限。

一个毫无逆向工程经验的攻击者,只需要点点鼠标,调用AI API,就能在一个下午把整个月积累的几十个补丁,全部转化为致命的攻击武器。

「N日漏洞」这个词更是已经out了。现在的真实情况是:「N小时漏洞」。


谁会是这场变革中最惨的受害者? 首当其冲的是那些更新缓慢、难以打补丁的系统,比如工业控制系统、医疗设备、物联网设备等。

面对令人绝望的「N小时」威胁,人类还有救吗?

Anthropic的博客在最后给出了防守方的破局之道:仅仅加快补丁部署已经不够了,防守必须从源头抓起。

迁移到内存安全语言:这是最釜底抽薪的一招。将关键的底层组件从C/C++迁移到Rust等内存安全语言。因为无论是火狐还是Windows内核,绝大多数极其危险的代码执行和提权漏洞,都源于内存管理错误。

硬件与底层缓解措施:采用控制流保护、硬件影子堆栈等技术,一次性退役掉整个类别的漏洞利用方式。

缩短空窗期:像Mozilla一样,将补丁的发布节奏从按月缩短为按周,甚至实时热修复。

2026年的夏天,Mythos Preview向世界宣告了网络安全旧纪元的终结。

正如Logan所说,一年后回头看,今天令我们震惊的Mythos或许只如儿戏。

但正是因为有了今天的预警,人类的防御网才不至于在未来的AI黑客面前溃不成军。

参考资料:

https://x.com/logangraham/status/2064220844168253500

编辑:Aeneas

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论
本版公告

欢迎访问资讯板块,我们将在本版块为您带来最新最全最热的资讯,包含互联网、科技、数码、电脑、科普、体育、娱乐、国内等新闻。所有新闻都为单纯事实消息的时事新闻,转载均注明了来源,版权归源站所有,如有侵权,烦请联系我们

更多【互联网】资讯...
拼多多新公司落户雄安:首批招聘1000人,计划提 0
你的朋友圈能搜了!微信官宣新功能 0
OpenAI欲扩张AI算力版图:据悉正洽谈租赁俄亥俄 0
微信AI联手“华米OV荣”搞大动作!颠覆电商App 0
摩尔线程开源面向GPU底层算子生成的专用代码大 0
摩尔线程MusaCoder开源:首个基于国产全功能GPU 0
618商家实测:京ME让“找人难”成历史 0
小红书发布《Skill上传规范》,明确平台立场 0
微信上线朋友圈搜索功能 0
OpenAI欲扩张AI算力版图 据悉正洽谈租赁俄亥俄 0