← 返回信息流
技术博客OpenAI Blog·8 小时前

OpenAI通过Appia基金会助力构建AI共享标准

原标题:Helping build shared standards for advanced AI

速览

OpenAI正通过Appia基金会积极参与高级人工智能共享标准的构建工作。该举措旨在支持评估框架的开发、推广安全实践,并促进全球范围内的合作。这标志着AI行业在标准化和安全治理方面迈出了重要一步。

AI 深度解读

助力构建先进 AI 的共同标准:OpenAI 的深度解读

背景

随着人工智能模型能力的日益增强,其带来的机遇与挑战并存。一方面,更强大的模型能够加强网络防御、加速科学发现并扩大专业知识的获取渠道;另一方面,如果对这些模型的能力存在误解、安全防护措施不足,或者政府缺乏应对所需的必要信息,它们也可能引发安全和风险隐患。

为了安全、自信地实现这些技术红利,社会需要建立具备技术和治理能力的机构,以评估、保障并监管日益复杂的 AI 系统。OpenAI 认为,建立共享的技术标准和信任机制是解决这一问题的关键路径。

核心内容

OpenAI 在博客中阐述了其在 AI 治理、标准制定及国际合作方面的最新举措与战略思考,主要涵盖以下几个层面:

1. 成立 Appia 基金会以构建信任层 OpenAI 协助创立了由 Linux Foundation 托管的 Appia 基金会。Appia 的核心任务是开发开放、模块化的规范,旨在将国际标准既有的框架转化为 AI 价值链各环节的实用评估标准。

  • 解决痛点:当模型、基础设施和应用由不同组织开发时,缺乏统一的信任机制。
  • 解决方案:Appia 致力于建立关键的“信任层”,让第三方能够检查合规性,从而产生更清晰、可复用的证据。
  • 最终目标:通过创建共享的技术语言,使国家和国际机构能够互信彼此的工作成果。

2. 民主治理前沿 AI 的蓝图 OpenAI 发布了关于前沿 AI 民主治理的蓝图,为相关工作提供了路线图:

  • 国内框架:呼吁建立持久的美国框架,加强人工智能标准与创新中心(CAISI),并制定更广泛的政府韧性战略。
  • 国际协作:承认前沿风险具有国际范围,各国应合作开发兼容的安全框架、建立共享风险发现的信任渠道,并对事件做出协调响应。
  • 机构协同:国家能力与国际合作应相互强化。强大的国家机构(如 CAISI)可发展技术专长、评估前沿系统并支持独立的评估生态系统,进而建立共享方法和可信证据认可机制。

3. 标准化评估实践与透明度 标准是该努力的核心,必须建立在可信的评估实践和技术严谨性之上。

  • 透明度要求:在《可信第三方评估共享手册》中,OpenAI 提出了前沿评估日益需要披露的关键要素:被测试的系统、工具访问权限和评估工具包、用于激发能力的方法、可用资源以及用于验证结果的检查措施。
  • 实践验证:OpenAI 已与美国的 CAISI 和英国的 AISI 建立测试合作伙伴关系。这些机构在前沿能力评估和生物滥用防范方面的研究,直接推动了 OpenAI 系统的实质性改进。这为标准化实践奠定了基础,使得性能检查可以在可比较的方式进行。

4. 内部安全基础设施与治理框架 上述外部标准工作补充了 OpenAI 更广泛的安全基础设施:

  • 准备框架(Preparedness Framework):这是定义和运营化管理先进 AI 系统最严重风险的基础,包括内部实践。
  • 前沿治理框架(Frontier Governance Framework):将上述方法应用于公共治理文件,专注于特定的监管义务,包括风险评估、模型报告、安全控制、事件响应以及纳入外部专家意见。
  • 作用:这些文件共同作用,将广泛的承诺转化为可验证和改进的操作实践。

5. 跨组织互操作性与生态系统参与 Appia 的工作旨在解决下一个挑战:使这些实践在不同组织、司法管辖区和供应链之间实现互操作。 OpenAI 已广泛参与更广泛的标准化和预标准化生态系统,包括:

  • 参与 ISO/IEC JTC 1/SC 42(人工智能联合技术委员会)。
  • 参与由美国国家标准与技术研究院(NIST)领导的 AI 联盟。
  • 帮助创立前沿模型论坛(Frontier Model Forum)和 Linux Foundation 的 Agentic AI 基金会。
  • 参与安全 AI 联盟(Coalition for Secure AI)。
  • 担任内容来源和真实性联盟(Coalition for Content Provenance and Authenticity)的指导委员会成员。
  • 参与互联网工程任务组(IETF)和 Fast Identity Online Alliance 的流程,以推进可互操作的技术标准。

关键要点

  • 信任层缺失:当前 AI 开发分散,缺乏让第三方验证合规性的通用“信任层”,导致证据难以复用和互信。
  • Appia 的角色:作为由 Linux Foundation 托管的新基金会,Appia 致力于将国际标准转化为实用的、模块化的评估规范,促进跨国、跨机构的互信。
  • 治理双轨制:OpenAI 强调国内制度(如加强 CAISI)与国际合作(如共享风险发现)必须相互强化,共同应对具有国际Scope的前沿风险。
  • 评估透明度:可信的第三方评估必须披露系统细节、工具、方法、资源和验证检查,这是建立标准化可比性能的基础。
  • 从承诺到实践:OpenAI 通过“准备框架”和“前沿治理框架”,将宏观的安全承诺转化为可操作、可验证的内部和公共治理实践。
  • 生态系统参与:OpenAI 不仅关注内部治理,还深度参与 ISO、NIST、IETF 等多个国际标准组织,旨在将前沿开发的经验转化为开放、技术扎实的行业实践。

意义与影响

OpenAI 的这一系列举措标志着大型 AI 模型开发商从单纯的技术竞争转向治理基础设施的建设

  1. 降低合规成本与摩擦:通过 Appia 推动的开放模块化规范,不同组织和司法管辖区可以采用统一的评估语言。这将减少重复评估,降低企业合规成本,并加速 AI 产品的全球部署。
  2. 增强社会信任:建立独立的第三方评估生态系统和透明的披露标准,有助于公众、监管机构和投资者更清晰地理解 AI 系统的安全状况,从而增强对先进 AI 技术的信任。
  3. 塑造全球治理范式:OpenAI 倡导的“国家能力与国际合作相互强化”的模式,为应对跨国 AI 风险提供了可操作的框架。通过 NIST、ISO 等渠道的参与,OpenAI 正在积极影响全球 AI 标准的走向,确保其技术实践成为行业基准。
  4. 推动技术向善:通过强调生物滥用防范、网络安全和透明度,OpenAI 试图将安全内化为 AI 价值链的核心部分,而非事后补救措施。这有助于引导整个行业向更负责任、更可持续的方向发展。

总之,OpenAI 正试图通过构建共享的技术标准和信任机制,解决先进 AI 发展中的“信任赤字”问题,为技术的长期安全和社会效益最大化奠定基础。

查看原文 →openai.com