技术博客OpenAI Blog·10 小时前

OpenAI发布Daybreak工具集，助力全球企业规模化修复漏洞

原标题：Daybreak: Tools for securing every organization in the world

速览

OpenAI近日发布名为Daybreak的新工具集，旨在协助全球各类组织提升网络安全防护能力。该工具集包含Codex Security和GPT-5.5-Cyber等组件，能够支持企业以规模化方式发现、验证并修复系统漏洞。此举标志着OpenAI在AI驱动的安全自动化领域迈出重要一步，有助于降低企业应对复杂网络安全威胁的成本与难度。

AI 深度解读

Daybreak：为全球组织提供机器速度的漏洞修复工具

OpenAI 正式宣布扩展其 Daybreak 计划，旨在通过机器速度实现漏洞软件补丁的民主化。这一举措标志着网络安全防御范式的重大转变：从单纯依赖人工发现漏洞，转向利用前沿 AI 模型加速漏洞的验证、修复和部署。

背景

长期以来，严重漏洞的发现依赖于稀缺的专业知识、大量时间以及对复杂系统的深刻理解。然而，随着前沿 AI 模型在漏洞发现方面的加速能力，安全防御者面临的瓶颈已不再是“找到漏洞”，而是“处理海量漏洞报告”。

目前的困境在于：

发现容易，修复难：AI 模型能够导航大型代码库、推理攻击路径并验证假设，从而揭示以往可能隐藏的漏洞。但仅仅提供漏洞报告并不能保护任何人。
防御者过载：防御者被大量的漏洞发现所淹没，缺乏足够的工具在攻击者利用这些漏洞之前进行修复。
能力集中：前沿防御能力不应仅集中在少数人手中。软件触及从关键基础设施到政府网络的各个层面，随着 AI 改变漏洞发现的节奏，所有防御者都需要民主化地访问这些模型，以便在攻击者识别并利用缺陷之前找到并修复它们。

因此，OpenAI 提出 Daybreak 计划，旨在将前沿网络安全能力、Trusted Access for Cyber（受信任的网络访问）、Codex Security 工作流以及生态系统合作伙伴整合在一起，帮助经过批准的防御者验证漏洞、优先考虑风险、生成和测试修复方案，并在现有的安全和开发工作流中生成证据。

核心内容

OpenAI 此次发布的更新涵盖了模型、工具、合作伙伴计划以及开源社区倡议，具体包括以下五个方面：

1. Codex Security 插件更新

Codex Security 是集成在 Codex 中的安全插件，其核心理念是将安全工程师的能力赋予每一位软件开发者。

工作原理：插件不仅生成警报，还能理解团队代码及其威胁模型（若不存在则自动生成），识别合理的漏洞，确定受影响代码是否可达，收集证据以提供验证步骤，开发针对性补丁，并验证结果。人类始终掌控着调查哪些发现、应用哪些更改以及共享哪些信息的决策权。
新功能：此次更新启用了开箱即用的防御性安全工作流。开发人员可以运行深度扫描或审查最近的更改，生成包含严重性、受影响代码位置、验证证据和修复指导的报告，追踪攻击路径，构建威胁模型，验证发现，并生成针对特定代码库的补丁供审查。
集成与自动化：插件还可以对来自扫描器、安全公告、漏洞赏金报告或票务系统的现有发现进行分类和验证，然后大规模自动生成补丁，以快速关闭漏洞积压。扫描完成后，可导出到现有的漏洞管理系统，或通过 SARIF 文件、CodeQL 查询等集成到工具中。此外，支持通过 Codex CLI 或 Codex App 集成到开发者工作流中。
成效数据：自 3 月以研究预览形式推出 Codex Security Cloud 以来，它已扫描了超过 30,000 个代码库中的 3,000 多万次提交；人工审核员手动标记了超过 70,000 个发现为已修复，另有超过 500,000 个发现被自动确定为已修复。

2. GPT‑5.5‑Cyber 正式发布

继最初的仅允许提示（permissive-only）预览版之后，OpenAI 通过持续的有限发布向受信任的防御者推出了 GPT‑5.5‑Cyber 的完整版本。

模型定位：这是一个既更宽容又更强大的模型，专为高级、授权的网络安全工作设计。它是目前 OpenAI 在发现和协助修补软件漏洞方面最强的模型，同时保留了 GPT‑5.5 的通用智能和处理长、复杂任务的能力。
性能提升：
- CyberGym：在衡量智能体是否能在软件环境中重现已知漏洞的基准测试中，更新后的 GPT‑5.5‑Cyber 在单模型评估中达到了 85.6% 的成绩，而 GPT‑5.5 为 81.8%。这是 OpenAI 从单模型中测得的最高 CyberGym 分数。
- ExploitGym：在测试智能体是否能将已知漏洞转化为实现未经授权代码执行的工作利用程序的基准上，GPT‑5.5‑Cyber 得分为 39.5%，优于 GPT‑5.5 的 25.95%。
- SEC-bench Pro：在评估跨复杂软件目标的长期漏洞发现和概念验证生成的基准上，GPT‑5.5‑Cyber 达到 69.8%，优于 GPT‑5.5 的 63.1%。
实际能力：该模型能够在大代码库中进行更深入的分析，识别与安全相关的组件，追踪漏洞代码是否可达，在受控环境中验证可能的问题，开发并测试补丁，并为人工审查准备证据。其目标是帮助防御者完成整个修复闭环，而不仅仅是产生更多的发现。

3. Daybreak 网络安全合作伙伴计划

该计划旨在通过向合作伙伴的产品和服务提供对其最强大模型的受信任访问，使网络安全合作伙伴能够将其效益扩展到更多组织。

4. Patch the Planet 倡议

这是一个与 Trail of Bits 合作发起，并与 HackerOne、加州研究人员和开源项目维护者协作的倡议，旨在帮助广泛使用的开源项目从“发现问题”过渡到“实施修复”。

参与项目：已有 30 多个开源项目承诺参与，初始参与者包括 cURL、Go、Python、Sigstore 和 pyca/cryptography。
目标：与研究人员、维护者、企业和伙伴合作，使强大的网络安全能力能够以适当的访问权限、治理和人工监督提供给防御者。

5. 政府合作与监管

OpenAI 与美国政府就其网络安全方法进行了持续对话，包括今天的公告以及即将发布的模型准备工作。这包括继续与 Center for AI Standards and Innovation (CAISI) 合作，对 GPT‑5.5 和 5.5-Cyber 进行部署前测试，并与 Office of the National Cyber Director (ONCD) 和 Office of Science and Technology Policy (OSTP) 合作。

关键要点

瓶颈转移：网络安全的主要瓶颈已从“发现漏洞”转变为“修复漏洞”。AI 模型擅长发现，但防御者急需工具来快速验证和修补。
Codex Security 的核心价值：通过直接将安全能力集成到开发流程中，实现“每个开发者身边都有一个安全工程师”。它不仅能发现漏洞，还能生成补丁、验证可达性并提供修复证据，支持大规模自动化修复。
GPT‑5.5‑Cyber 的性能突破：作为专为网络安全设计的模型，它在多个基准测试（CyberGym、ExploitGym、SEC-bench Pro）中均显著优于通用模型 GPT‑5.5，特别是在漏洞重现和利用程序生成方面表现突出。
民主化访问：通过 Daybreak 计划、合作伙伴计划以及 Patch the Planet 开源倡议，OpenAI 致力于让更广泛的组织（包括开源社区）能够以受控、安全的方式使用前沿 AI 安全能力。
人机协作：尽管 AI 能力强大，但人类始终保留最终决策权，包括决定调查哪些发现、应用哪些更改以及共享哪些信息，确保治理和人工监督。
实际影响：截至发布时，Codex Security 已扫描数千万次提交，自动和人工修复了数十万个发现，展示了机器速度下补丁修复的可行性规模。

意义与影响

Daybreak 计划的推出标志着 AI 在网络安全领域的应用从“辅助发现”迈向“主动修复”的新阶段。

重塑安全开发流程：通过将 Codex Security 深度集成到开发

查看原文 →openai.com