OpenAI呼吁全球行动,提议设立国际机构加强青少年AI安全
速览
OpenAI正式呼吁全球采取行动应对青少年AI安全问题,并提出建立国际机构的构想。该机构致力于强化相关安全护栏与行业标准,同时为年轻人创造更多发展机会。此举标志着AI行业在未成年人保护与全球治理层面迈出了重要一步。
AI 深度解读
通过全球领导力推进青少年安全与机遇:OpenAI 呼吁建立国际青少年 AI 安全研究所
背景
随着人工智能(AI)技术的快速普及,其作为赋能工具的价值日益凸显。AI 能够帮助学生理解复杂概念、练习新语言、准备求职面试、探索创意或学习新技能。正如 20 世纪中叶的扫盲运动依赖于印刷品的广泛分发和合格教师的普及一样,当今时代,提供安全、可及的 AI 访问权限将解锁个性化学习的新机遇,帮助弱势群体降低门槛,并提升劳动力的就业准备度。
然而,鉴于潜在的巨大收益,确保青少年能够以安全、适龄且支持其健康成长的方式使用 AI 变得至关重要。这一责任不应主要由父母或青少年自身承担。包括 OpenAI 在内的科技公司有义务在产品中默认内置适当的安全保障措施,同时赋予家庭引导 AI 使用的工具和信息。
本月晚些时候,各国领导人将在法国 Évian 举行的 G7 领导人峰会上聚集。届时,青少年 AI 安全将成为关键议题。OpenAI 将参与此次峰会,讨论加强在青少年安全领域的合作,探讨如何共同提升行业标准,并正式呼吁建立一个国际性的青少年安全研究所(International Youth Safety Institute)。
G7 峰会为全球协调青少年安全工作提供了难得的机会,但单一的峰会无法确保持续的关注。一个专门的研究所将提供必要的连续性和后续执行力,帮助政府、研究人员、民间社会和业界在长时间内共同分享证据、制定指导方针并提升标准。
核心内容
OpenAI 提出,建立此类研究所的路径可以是多样的:既可以通过建立一个新的国际研究所来实现,也可以赋予现有的或新成立的国家级 AI 研究所以全球使命,使其能够与全球合作伙伴分享研究、证据和指导。无论形式如何,最关键的是其发挥的功能。青少年 AI 安全需要持续的注意力、可信的证据以及能跟上技术步伐的实用指导。
该研究所可以借鉴并建立在新兴倡议的基础之上,例如由 OpenAI 基金会支持的 Common Sense Media 的青少年 AI 安全研究所,以及与教育工作者(如 OpenAI 与美国教师联合会)的实际合作。此外,还应利用现实世界的部署案例,例如爱沙尼亚在全国学校范围内推广 ChatGPT 的项目。在该项目中,OpenAI 正与斯坦福大学及爱沙尼亚研究人员合作,研究其影响,从而为更安全、更有效的学习使用提供依据。
OpenAI 欢迎与法国政府、其他 G7 成员国政府以及民间社会、学术界和业界的合作伙伴在这一重要工作中展开合作,共同提升全球青少年安全标准。
OpenAI 认为,强大的 AI 青少年安全框架(包括在 G7 会议上可能达成的任何协议)应基于以下原则:
-
识别未成年人并实施适龄保护:公司应知道用户是否为未成年人,并应用适龄保护措施。这意味着要求提供商使用有效且保护隐私的年龄估算手段来区分未成年人与成年人,并在无法确定用户年龄时,默认启用保护性安全措施。如果没有这一基础,即使是出于良好意愿的青少年保护措施也可能无法触及目标人群。
-
定期评估风险与收益:公司应定期评估针对青少年的风险和收益,并在伤害发生前采取措施加以解决。这要求提供商完成年度青少年安全风险评估,并根据识别出的风险实施相称的安全措施。评估应考虑基于青少年发展阶段的风险、实际使用的实证证据以及相关研究或监管指导。评估不仅应关注潜在危害,还应考虑 AI 是否支持学习、创造力、技能发展和机会获取等积极成果。
-
赋予父母易于使用的控制权:父母和监护人应拥有易于使用的控制工具,以帮助他们引导孩子的体验,同时支持适龄的独立性。这些工具应包括管理关键设置的功能,如记忆、数据使用和时长限制。应积极推广父母工具,确保父母知晓其存在并了解如何使用。
-
提供清晰透明的信息:家庭有权获得关于公司如何保护年轻用户以及 AI 使用对青少年的益处和风险的信息。公司应公布安全政策,说明已采取的保护措施、可用的父母工具以及随着风险演变如何更新保护措施。这种透明度有助于建立信任,帮助父母做出明智的选择。
-
建立应对严重安全事件的协议:公司应制定明确的协议,以应对包括自残、剥削、诱骗、性剥削内容及其他高风险互动在内的严重安全情况。这些协议应包括在线支持、转介至适当资源以及在适当时候及时通知父母。此外,公司应设计系统以防止生成对儿童不安全或发展上不适宜的内容,包括露骨的性或暴力材料。
-
AI 应支持而非取代真实关系:供青少年使用的 AI 系统应设计为支持学习、发展和现实世界的人际关系,而不是取代它们。AI 应作为帮助青少年学习、创造、建立技能和为未来做准备的工具。同时,公司应在那些健康发育依赖于人类判断、现实世界关系和专业支持的领域建立明确的界限。
-
保护未成年人的个人信息:这意味着禁止针对青少年的侵入性隐私广告,并禁止公司出售个人信息。
-
促进机遇、素养与保护:青少年安全框架应促进机遇、素养和保护。青少年应能访问支持学习、创造力、技能发展和未来机遇的 AI 工具,同时具备安全、负责任地使用 AI 所需的知识批判性思维技能。这包括推广 AI 素养,帮助青少年理解 AI 系统的机遇和局限性,使他们在数字空间中能够自信且负责任地参与。
-
强有力的问责机制:包括独立审计在内的强大问责机制对于确保这些保护措施在实践中具有意义至关重要。审计应基于一套共同的标准,以实现跨司法管辖区的审计互操作性。立法框架应包括监督和执法措施,使政府能够评估公司是否有效实施了青少年安全保护措施、减轻了已识别的风险,并遵守了青少年安全和隐私义务。
这些原则已反映在 OpenAI 构建和运营 ChatGPT 的方式中,从模型行为和产品设计到专家输入和现实世界支持。OpenAI 已加强了对 18 岁以下用户的安全措施,推出了带有主动通知功能的父母控制功能,并推进了年龄预测系统,以便在用户可能未满 18 岁时应用更强的保护措施。其《模型规范》(Model Spec)也包含了针对 18 岁以下用户的专用原则,优先考虑青少年安全、适龄体验、现实世界支持和明确预期。在实践中,这意味着围绕自残、危险活动、露骨内容、身体形象和保密性方面加强了护栏,并鼓励在需要时寻求可信赖的线下支持或危机资源。当年龄不确定时,系统默认采取更严格的保护措施。
关键要点
- 呼吁建立专门机构:OpenAI 正式呼吁在 G7 峰会期间讨论并建立一个国际性的青少年 AI 安全研究所,或通过赋予现有国家级机构全球使命的方式,确保持续的全球协调与标准提升。
- 责任主体明确:青少年 AI 安全不仅是家庭的责任,科技公司必须承担主要责任,通过默认内置的安全措施和透明的政策来保障用户安全。
- 九大核心原则:
- 利用隐私保护的年龄估算技术识别未成年人,并在年龄不明时默认启用保护。
- 进行年度风险评估,平衡潜在危害与学习、创造力等积极收益。
- 提供易用的父母控制工具(管理记忆、数据、时长)。
- 公开透明的安全政策和风险更新机制。
- 针对自残、剥削等高风险内容建立严格的干预和通知协议。
- AI 定位为辅助工具,不得取代人类判断和现实人际关系。
- 严禁针对青少年的侵入性广告和个人信息买卖。
- 结合 AI 素养教育,提升青少年批判性思维和负责任使用能力。
- 引入独立审计和立法监督,确保措施落地有效。
- 实践案例支撑:OpenAI 强调其方法论基于实际合作与部署,包括与 Common Sense Media、美国教师联合会以及爱沙尼亚国家教育项目的合作。
- ChatGPT 的具体落地:OpenAI 指出其已在 ChatGPT 中实施上述原则,包括强化 18 岁以下用户的护栏、推出父母控制功能以及优化年龄预测算法。
意义与影响
1. 推动全球 AI 治理从“峰会政治”走向“制度化合作” OpenAI 提出的建立“国际青少年安全研究所”的建议,旨在解决 G7 等峰会机制缺乏持续执行力的问题。通过建立一个专注于分享证据、制定指南的常设机构,全球 AI 安全治理有望从短期的政治宣言转向长期的技术标准和
