

你敢信吗?
2025年12月才开始搭建的全球最难安全测试题,到2026年5月,已经被AI全部做完了!
澳洲研究机构Lyptus Research的最新报告扔出一颗重磅炸弹:GPT-5.5在316道进攻性网络安全任务中,成功解出292道,正确率高达92.4%!剩下那24道没解出来的题,连画一条有统计意义的能力曲线都不够了。
研究团队的结论更扎心——这套评估方法,对这些AI来说,已经"不再适用"了。
三个月前数据刚冒饱和苗头,两个月后直接变事实。从"最难"到"不够用",只用了六个月。
Lyptus从2024年开始追踪AI的进攻性网络安全能力,拟合出的结论让人后背发凉:AI在这方面的能力,每5到6个月翻一倍。
什么叫"时间地平线"?简单说就是AI能持续攻击多长时间。
2026年初,Claude Opus 4.6的时间地平线是3.2小时,GPT-5.3 Codex是3.1小时。两个月后,GPT-5.5直接拉到5.1小时。
给够算力,冲过12小时的测量上限,图表甚至画不下!
更狠的是Token预算这个变量。
GPT-5.5在最难的基准CyberGym上,200万Token预算下正确率只有54.4%。但当预算推到5000万Token,正确率飙到86.4%!
同一个模型,只因为多给算力,就涨了32个百分点!
英国人工智能安全研究所(AIUK)的研究也证实了这一点:给到1亿Token,能力还在涨,根本没有平台期。
这意味着什么?所有公开的基准测试成绩,都是在有限预算下跑出来的。真实能力天花板,远比账面数字高得多!
面对这种局面,头部实验室已经被迫站队了。
Anthropic在4月发布Claude Mythos Preview,直接决定不公开,理由是网络安全能力过强。他们同步推出Project Glasswing,把Mythos部署给关键基础设施的防御方。
OpenAI给GPT-5.5的网络安全能力评级定为"High",仅比最高级"Critical"低一档。攻击相关能力全部通过"Trusted Access for Cyber"门控。
控制谁能用,是目前唯一的策略。
但窗口在缩小。
Lyptus测量了一个叫"适应缓冲期"的指标,也就是闭源前沿能力传导到开源模型的时间差。
在进攻性网络安全领域,这个差距大约只有5.7到13.1个月。
按这个速度,Mythos和GPT-5.5级别的攻击能力,年内就可能以开源形式落到任何人手里。
到时候,谁来控制?谁能控制?
回到最核心的问题。
这件事里最让人不安的部分,在于没人能准确说出大模型的上限到底有多强。
时间地平线的逻辑很简单:用比模型能力更难的任务来锚定曲线的拐点。
但问题是,当模型把所有任务都做完了,拐点就消失了,曲线没法拟合了。
评估体系不是被证伪了,是被能力增长甩在了后面。
要造更难的测试,需要更多时间和人力。
模型能力每半年翻一倍,但测试开发周期远长于此。
更关键的是英国人工智能安全研究所的发现:只要攻击方愿意多烧算力,就算有更难的题,照样做穿。
评估追不上能力,这就是最残酷的现实。
一个高度专业化的领域里,人类为AI能力设定的标尺已经被干碎了。
网络安全恰好是最容易量化的领域之一——漏洞找到或没找到,系统攻破或没攻破,清清楚楚。
连这种硬指标领域的评估都跟不上了,那些更模糊、更难量化的能力维度呢?
每6个月翻一倍的增速如果维持,一年后的能力是今天的4倍,两年后16倍。
通往AGI乃至ASI的路上,被干碎的不会只有这一把尺子。
看不到边界,比边界本身更危险。
你觉得,当AI的攻击能力测试全部饱和后,防御能力测试还能撑多久?
评论区聊聊你的看法!
如果这个趋势让你感到震撼,点个赞和在看,让更多人看到这把被干碎的尺子!