AI 资讯Hacker News·2 小时前

后神话时代网络安全：保持冷静并继续前行

原标题：Post-Mythos Cybersecurity: Keep calm and carry on

速览

本文聚焦于后Mythos时代的网络安全环境，指出传统防御模式已不足以应对当前挑战。文章建议企业需调整心态，在不确定性中保持冷静，并确保持续的业务运营能力。这一理念对于提升整体安全韧性具有重要意义。

AI 深度解读

Post-Mythos Cybersecurity: Keep calm and carry on

背景

近期，Anthropic 发布了备受瞩目的 Claude Mythos Preview，随后推出了具有严格安全限制的等价版本 Fable 5。这一系列动作在网络安全领域引发了巨大的争议、恐惧与不确定性（FUD）。Anthropic 通过“Project Glasswing”项目，最初仅向 50 家机构开放访问权限，后扩展至 150 家，并宣称 Mythos 在自动化零日漏洞挖掘和攻击链测试方面取得了突破性进展，甚至被英国政府 AI 安全研究所评为首个在“专家级任务”中成功的模型。

然而，随着 Mythos 及其受限版本 Fable 5 的短暂发布与随后下架，以及美国政府对非美国公民访问 Fable/Mythos 的禁令，行业进入了一个充满变数的“后神话时代”。与此同时，OpenAI 也在通过 GPT-5.5-Cyber 和 Codex Security 插件等工具加速追赶，并在美国政府的监管压力下采取了更为谨慎的防御导向策略。本文旨在透过营销噪音，冷静分析 AI 在网络安全领域的真实能力、潜在风险以及对行业的长期影响。

核心内容

1. 营销叙事与真实能力的落差

Anthropic 一贯擅长在公关宣传中使用戏剧性措辞。Mythos 的发布伴随着对安全性的担忧和对监管的呼吁。尽管官方宣称其能发现数百个漏洞，包括 OpenBSD 中 27 年的老漏洞和 FFmpeg 中 16 年的老漏洞，但深入分析显示，这种进步是渐进式的，而非颠覆性的。

基准测试的局限性： Mythos 在 Cyber Range（网络靶场）测试中实现了从侦察到完全接管网络的“最后一击”，但这与真实的企业环境存在巨大差异。测试环境缺乏活跃防御者和防御工具，且模型执行触发警报的动作不会受到惩罚。在真实环境中，此类模型在侦察和横向移动时会显得极其嘈杂且笨拙。
竞争对手的表现： GPT-5.4 和 Opus 4.6 在高级 CTF 挑战中紧随其后。对于拥有成熟网络安全计划和专门 SOC（安全运营中心）的企业而言，这些基准测试的结果往往缺乏现实参考价值。

2. 漏洞发现的本质：成本而非智能的突破

关于 Mythos 能发现“关键零日漏洞”的说法，主要是 Project Glasswing 的营销论点。资深安全专家对此持怀疑态度：

陈旧漏洞并非新发现： 在拥有数十万行代码的开源产品中，存在数十年历史的漏洞并不罕见。这通常意味着此前无人具备足够的能力去检查该区域，而非漏洞本身难以发现。
高昂的成本驱动： Mythos 的优势在于其可扩展性，但这需要巨额资金支撑。Anthropic 的红队博客透露，为了发现 BSD 漏洞，模型在单个源代码文件上运行了数千次，耗时约 20,000 美元。整个 Glasswing 项目的代币预算高达一亿美元。
风险受众： 这种 exhaustive search（穷举搜索）带来的风险主要面向拥有先进网络安全资源的大型实体，而非普通的脚本小子（script kiddie）。

3. 模型能力评估：误报率与利用证明

虽然 Mythos 在漏洞发现上投入巨大，但其他模型也在通过更经济的方式取得进展：

替代方案的竞争力： DeepSeek 在云托管领域表现尚可，而 Gemma 4 和 Qwen 3.6 在自托管类别中表现出色，能够发现 Mythos 基准测试中约一半的漏洞。
误报率与利用证明： 有观点认为秘密在于“Harness”（测试框架）而非模型本身。虽然较小的 LLM 也能检测到许多漏洞，但它们无法生成有效的利用代码（Exploit）。Mythos 级别模型的优势在于不仅能发出警告，还能证明漏洞的可利用性，从而显著降低了早期 AI 漏洞挖掘中常见的误报问题。Mozilla 和 Cloudflare 均声称其误报率极低，优于人类测试人员，但这仍需更广泛访问后的验证。

4. 地缘政治与监管干预

美国政府的禁令： 美国政府禁止非美国公民（包括在美国境内的人）访问 Fable/Mythos，迫使 Anthropic 关闭了该服务。这反映了 Anthropic 多年来倡导的“更多政府参与以控制使用和减缓 AI 竞赛”策略的反噬。
OpenAI 的防御性策略： OpenAI 推出了 GPT-5.5-Cyber 和 Codex Security 插件，以及等效项目“Daybreak”和“Patch the Planet”。与 Anthropic 不同，OpenAI 降低了恐惧营销色彩，专注于防御侧，并严格控制发布范围以避免触碰美国监管红线。这是一种“人为稀缺”，大型网络安全公司可访问并高价转售给其客户，而普通企业无法直接获得。

5. 最新动态（2026-6-27 更新）

局势发展迅速。OpenAI 发布了新模型家族 Sol、Terra 和 Luna，重点宣传其网络安全能力并与 Mythos 对比。这些模型同样偏向防御而非构建利用代码。然而，美国政府仍要求对访问新模型的机构进行审查。Anthropic 也重新开放 Mythos，但最初仅向 100 家美国机构开放。

关键要点

渐进式进步而非颠覆： Mythos 在网络安全任务上的表现是以往模型（如 GPT-5.4, Opus 4.6）的渐进式提升，而非质的飞跃。其优势主要源于巨大的计算成本和穷举搜索能力，而非模型智能的根本性突破。
真实环境与基准测试的差异： 官方发布的基准测试（如 Cyber Range）缺乏真实企业环境中的活跃防御和惩罚机制，导致模型在真实场景中可能表现不佳且噪音巨大。
经济门槛限制风险扩散： 实现此类自动化漏洞挖掘的成本极高（单漏洞发现成本约 2 万美元，项目总预算上亿美元），这意味着主要风险来自拥有雄厚资源的大型实体，而非普通攻击者。
误报率降低是核心价值： Mythos 级别模型的关键优势在于能够证明漏洞的可利用性，从而大幅降低误报率，这是早期 AI 漏洞挖掘工具的主要痛点。
监管与人为稀缺： 美国政府通过禁令和审查机制介入 AI 安全模型的部署，导致技术访问权受限。OpenAI 和 Anthropic 均采取了防御导向和受限发布的策略，形成了“负责任部署”名义下的人为稀缺，大型安全厂商成为主要受益者。
防御优于攻击： 当前主流 AI 安全模型（如 OpenAI 的新模型）的设计趋势是偏向防御和补丁生成，而非自动化攻击利用，以符合监管要求和伦理标准。

意义与影响

1. 网络安全行业的理性回归

Mythos 事件初期引发的恐慌揭示了行业对 AI 能力的过度想象。实际上，AI 在网络安全中的应用仍处于辅助阶段，其价值在于处理海量数据和降低误报，而非完全替代人类专家或实现全自动化的零日攻击。企业和安全团队应保持冷静，继续依赖成熟的防御体系和人工分析，避免被营销术语误导。

2. 安全支出的结构性变化

由于 AI 漏洞挖掘的高成本特性，中小企业可能难以直接利用此类技术进行主动防御或攻击。相反，大型网络安全公司将成为 AI 安全工具的主要入口，通过订阅服务将能力转售给客户。这可能导致安全服务市场的进一步集中化，中小企业需依赖第三方专业服务商来提升安全水位。

3. 监管成为 AI 安全发展的关键变量

美国政府的干预表明，AI 在网络安全领域的应用已不再仅仅是技术问题，而是地缘政治和国家安全问题。未来的 AI 安全模型开发将受到更严格的出口管制和访问限制。开发者需要在合规框架内设计产品，而用户则需关注数据主权和访问权限的不确定性。

4. 防御体系的适应性调整

尽管 AI 攻击能力有所提升，但其高昂的成本和当前的防御导向趋势意味着，传统的防御措施（如主动防御、入侵检测、代码审计）依然有效。企业应继续加强 SOC 建设，利用 AI 工具辅助分析，但不应过度依赖自动化攻击模拟。同时，需警惕 AI 生成的虚假警报，建立更智能的告警过滤机制。

**5. 长期展望：人机协作

查看原文 →cephalosec.com