Anthropic要求Fable和Mythos保留30天数据
速览
Anthropic宣布对其Fable和Mythos产品实施30天的数据保留政策。此举旨在加强数据审计与合规性,确保模型交互记录可追溯。该政策适用于所有使用这两项服务的客户,体现了Anthropic对AI安全与透明度的重视。
AI 深度解读
Anthropic 宣布对 Fable 和 Mythos 模型实施 30 天数据保留政策
背景
Anthropic 近期宣布,为了确保负责任地部署具备强大能力的 Mythos 系列模型,公司将调整其数据保留策略。这一政策变化主要针对那些目前采用“零数据保留”(Zero Data Retention, ZDR)设置的企业级用户和特定云合作伙伴环境。
随着 Claude Fable 5 和 Claude Mythos 5 等新一代模型的推出,模型能力实现了显著提升,但也带来了潜在的安全挑战。Anthropic 指出,虽然这些模型内置了针对网络生物领域的安全护栏,但为了有效检测复杂的滥用模式(如针对特定攻击的变体测试或国家级的间谍活动),需要暂时保留提示词(Prompts)和输出内容以便进行联合分析。该政策定于 2026 年 6 月 9 日 正式生效。
核心内容
Anthropic 发布了一项新的数据保留政策,要求在使用 Mythos 系列模型及未来被指定为“受控模型”(Covered Models)时,必须保留用户提交的提示词和模型生成的输出内容,保留期限为 30 天。这一措施旨在通过信任与安全(Trust and Safety)工作,监控和识别潜在的滥用行为。
适用范围与例外情况
- 受影响群体:此政策仅适用于以下设置了“零数据保留”(ZDR)的组织:
- 在 Claude Console 中设置 ZDR 的工作区。
- 在 Claude Enterprise 中使用带有 ZDR 的 Claude Code。
- 通过 AWS Bedrock、Google Cloud Agent Platform 或 Microsoft Foundry 访问 Claude 且启用 ZDR 的用户。
- 不受影响群体:
- 消费者计划用户(包括 Claude Free、Pro 和 Max),无论是在 Web、桌面端、移动端应用,还是通过 Claude.ai 和 Claude Code 访问,均不受此更新影响。因为这些平台本身已经出于安全目的保留输入和输出数据。
- 其他所有未启用 ZDR 的组织,其现有条款保持不变。
为何需要数据保留
Anthropic 解释了这一保守策略的技术必要性:
- 检测复杂攻击模式:某些攻击(如 Best-of-N 越狱攻击)会发送数百个提示词的细微变体,试图找到能绕过安全护栏的那个。单独分析单个请求无法发现此类模式,必须将多个请求放在一起分析。
- 识别大规模滥用:国家级间谍活动或数据勒索活动等大规模滥用行为,只有当安全分类器能够“放大视角”、跨多个请求进行分析时才会显现。
- 模型特性:Claude Mythos 5 代表了模型能力的重大飞跃,部分能力既可善也可恶。Claude Fable 5 共享相同的底层模型,但增加了额外的安全护栏,特别是在网络和生物领域。尽管有这些护栏,Anthropic 仍采取保守方法以监控潜在的模式滥用。
数据保护措施
Anthropic 强调了对保留数据的严格保护机制:
- 访问限制:Anthropic 员工仅在数据被标记为可能存在严重危害,或应客户书面要求时,才能访问对话内容。
- 审查流程:审查只能由一小批经过批准的审查员通过专用工具进行,该工具防止导出、复制或下载数据。
- 审计日志:每次访问都会被记录在防篡改日志中,审查员无法抑制或修改这些日志。
- 自动删除:30 天后,数据会自动删除,除非它属于安全调查的一部分或法律要求保留。
- 额外选项:符合条件的组织可以选择添加客户管理的加密密钥(Customer-Managed Encryption Keys)和访问透明度审计日志。
配置指南
对于需要启用数据保留以使用受控模型的组织,Anthropic 提供了具体的配置路径:
-
通过 Anthropic API (Claude Platform):
- 直接访问:在开发者控制台中,进入
Workspace > Manage > Privacy Controls开启保留功能。其他启用 ZDR 的工作区保持不变。 - 通过 AWS:配置方式与直接 API 相同,在 Workspace 级别配置,数据由 Anthropic 在相同控制下处理。
- 通过 Amazon Bedrock:需要启用保留才能访问新模型,保留的数据存储在用户的 AWS 环境中。
- 通过 Google Cloud Agent Platform:需要启用保留,数据存储在 GCP 环境中。
- 通过 Azure Foundry:保留功能针对每个 Azure 订阅配置。如果当前配置了 ZDR,用户需要创建并使用一个单独的 Azure 订阅来访问这些模型。
- 直接访问:在开发者控制台中,进入
-
通过 Claude Code:
- 通过 Anthropic API:数据管理遵循其运行的工作区设置。如果工作区启用了保留,Claude Code 即可使用受控模型。
- 通过 AWS Bedrock 或 Google Cloud Agent Platform:Claude Code 使用用户的云凭据,因此遵循云环境的保留设置。数据保留在提供商环境中。这也适用于通过上述平台访问的 Cowork。
- 通过 Claude Enterprise (ZDR):Anthropic 将在管理控制台中发布新控件,允许主要所有者(Primary Owner)直接更改保留设置。如果不希望更改生产组织设置,Anthropic 可协助设置单独的沙盒组织。
-
通过 Claude for Enterprise 的 Chat 或 Cowork:
- 这些界面已经运行标准保留策略,因此在新模型可用时将直接获得访问权限,无需额外配置。
关键要点
- 政策生效时间:2026 年 6 月 9 日。
- 保留期限:Mythos 系列及未来指定模型的提示词和输出内容将保留 30 天。
- 核心目的:通过联合分析多个请求,检测 Best-of-N 越狱、国家级间谍活动等复杂或大规模的安全威胁。
- 用户分层:
- 消费者用户(Free/Pro/Max):完全不受影响,因已有安全保留机制。
- 企业用户:仅影响当前启用“零数据保留”(ZDR)的高级安全设置用户。
- 数据安全承诺:
- 员工访问需严格审批且仅限防篡改工具。
- 所有访问行为记录在防篡改日志中。
- 30 天后自动删除,除非涉及调查或法律要求。
- 支持客户管理加密密钥和审计日志。
- 云厂商差异:
- AWS/Google Cloud:数据保留在用户自己的云环境中。
- Azure Foundry:若原设为 ZDR,需新建独立订阅以启用保留并访问新模型。
- Anthropic Direct/AWS Bedrock (via Platform):数据由 Anthropic 在控制下处理。
意义与影响
Anthropic 的这一政策调整反映了 AI 行业在追求模型能力突破与保障安全合规之间的平衡尝试。
首先,明确了“零数据保留”并非绝对。对于最高级别的能力模型(Mythos 系列),Anthropic 认为出于公共安全和防止恶意滥用的需要,必须牺牲部分数据隐私承诺(即从 ZDR 变为 30 天保留)。这对于那些对数据隐私有极致要求、且依赖 ZDR 作为核心卖点的企业客户来说,是一个重要的合规性考量因素。
其次,技术上的必要性得到了解释。Anthropic 没有简单地以“安全”为由强制保留数据,而是具体指出了“Best-of-N 越狱”和“大规模模式识别”等技术原因。这表明其安全团队正在采用更主动、更复杂的检测手段,而非仅仅依赖静态的规则过滤。
最后,对云合作伙伴生态的影响。政策对不同云平台(AWS, GCP, Azure)的处理方式略有不同,特别是 Azure 要求新建订阅,这可能会增加部分用户的运维复杂度。而对于 AWS 和 GCP 用户,数据保留在用户自己的云环境中,这在一定程度上缓解了用户对 Anthropic 直接持有数据的担忧,符合企业级客户对数据主权(
