技术博客OpenAI Blog·9 小时前

OpenAI通过Appia基金会助力构建AI共享标准

原标题：Helping build shared standards for advanced AI

速览

OpenAI正通过Appia基金会积极参与高级人工智能共享标准的构建工作。该举措旨在支持评估框架的开发、推广安全实践，并促进全球范围内的合作。这标志着AI行业在标准化和安全治理方面迈出了重要一步。

随着人工智能模型能力的日益增强，其带来的机遇与挑战并存。一方面，更强大的模型能够加强网络防御、加速科学发现并扩大专业知识的获取渠道；另一方面，如果对这些模型的能力存在误解、安全防护措施不足，或者政府缺乏应对所需的必要信息，它们也可能引发安全和风险隐患。

为了安全、自信地实现这些技术红利，社会需要建立具备技术和治理能力的机构，以评估、保障并监管日益复杂的 AI 系统。OpenAI 认为，建立共享的技术标准和信任机制是解决这一问题的关键路径。

OpenAI 在博客中阐述了其在 AI 治理、标准制定及国际合作方面的最新举措与战略思考，主要涵盖以下几个层面：

1. 成立 Appia 基金会以构建信任层 OpenAI 协助创立了由 Linux Foundation 托管的 Appia 基金会。Appia 的核心任务是开发开放、模块化的规范，旨在将国际标准既有的框架转化为 AI 价值链各环节的实用评估标准。

2. 民主治理前沿 AI 的蓝图 OpenAI 发布了关于前沿 AI 民主治理的蓝图，为相关工作提供了路线图：

国内框架：呼吁建立持久的美国框架，加强人工智能标准与创新中心（CAISI），并制定更广泛的政府韧性战略。
国际协作：承认前沿风险具有国际范围，各国应合作开发兼容的安全框架、建立共享风险发现的信任渠道，并对事件做出协调响应。
机构协同：国家能力与国际合作应相互强化。强大的国家机构（如 CAISI）可发展技术专长、评估前沿系统并支持独立的评估生态系统，进而建立共享方法和可信证据认可机制。

3. 标准化评估实践与透明度 标准是该努力的核心，必须建立在可信的评估实践和技术严谨性之上。

透明度要求：在《可信第三方评估共享手册》中，OpenAI 提出了前沿评估日益需要披露的关键要素：被测试的系统、工具访问权限和评估工具包、用于激发能力的方法、可用资源以及用于验证结果的检查措施。
实践验证：OpenAI 已与美国的 CAISI 和英国的 AISI 建立测试合作伙伴关系。这些机构在前沿能力评估和生物滥用防范方面的研究，直接推动了 OpenAI 系统的实质性改进。这为标准化实践奠定了基础，使得性能检查可以在可比较的方式进行。

4. 内部安全基础设施与治理框架 上述外部标准工作补充了 OpenAI 更广泛的安全基础设施：

准备框架（Preparedness Framework）：这是定义和运营化管理先进 AI 系统最严重风险的基础，包括内部实践。
前沿治理框架（Frontier Governance Framework）：将上述方法应用于公共治理文件，专注于特定的监管义务，包括风险评估、模型报告、安全控制、事件响应以及纳入外部专家意见。
作用：这些文件共同作用，将广泛的承诺转化为可验证和改进的操作实践。

5. 跨组织互操作性与生态系统参与 Appia 的工作旨在解决下一个挑战：使这些实践在不同组织、司法管辖区和供应链之间实现互操作。 OpenAI 已广泛参与更广泛的标准化和预标准化生态系统，包括：

信任层缺失：当前 AI 开发分散，缺乏让第三方验证合规性的通用“信任层”，导致证据难以复用和互信。
Appia 的角色：作为由 Linux Foundation 托管的新基金会，Appia 致力于将国际标准转化为实用的、模块化的评估规范，促进跨国、跨机构的互信。
治理双轨制：OpenAI 强调国内制度（如加强 CAISI）与国际合作（如共享风险发现）必须相互强化，共同应对具有国际Scope的前沿风险。
评估透明度：可信的第三方评估必须披露系统细节、工具、方法、资源和验证检查，这是建立标准化可比性能的基础。
从承诺到实践：OpenAI 通过“准备框架”和“前沿治理框架”，将宏观的安全承诺转化为可操作、可验证的内部和公共治理实践。
生态系统参与：OpenAI 不仅关注内部治理，还深度参与 ISO、NIST、IETF 等多个国际标准组织，旨在将前沿开发的经验转化为开放、技术扎实的行业实践。

OpenAI 的这一系列举措标志着大型 AI 模型开发商从单纯的技术竞争转向治理基础设施的建设。

降低合规成本与摩擦：通过 Appia 推动的开放模块化规范，不同组织和司法管辖区可以采用统一的评估语言。这将减少重复评估，降低企业合规成本，并加速 AI 产品的全球部署。
增强社会信任：建立独立的第三方评估生态系统和透明的披露标准，有助于公众、监管机构和投资者更清晰地理解 AI 系统的安全状况，从而增强对先进 AI 技术的信任。
塑造全球治理范式：OpenAI 倡导的“国家能力与国际合作相互强化”的模式，为应对跨国 AI 风险提供了可操作的框架。通过 NIST、ISO 等渠道的参与，OpenAI 正在积极影响全球 AI 标准的走向，确保其技术实践成为行业基准。
推动技术向善：通过强调生物滥用防范、网络安全和透明度，OpenAI 试图将安全内化为 AI 价值链的核心部分，而非事后补救措施。这有助于引导整个行业向更负责任、更可持续的方向发展。

总之，OpenAI 正试图通过构建共享的技术标准和信任机制，解决先进 AI 发展中的“信任赤字”问题，为技术的长期安全和社会效益最大化奠定基础。