AI 资讯Hacker News·1 天前

Anthropic要求Fable和Mythos保留30天数据

原标题：Anthropic requires 30 day data retention for Fable and Mythos

速览

Anthropic宣布对其Fable和Mythos产品实施30天的数据保留政策。此举旨在加强数据审计与合规性，确保模型交互记录可追溯。该政策适用于所有使用这两项服务的客户，体现了Anthropic对AI安全与透明度的重视。

AI 深度解读

Anthropic 宣布对 Fable 和 Mythos 模型实施 30 天数据保留政策

背景

Anthropic 近期宣布，为了确保负责任地部署具备强大能力的 Mythos 系列模型，公司将调整其数据保留策略。这一政策变化主要针对那些目前采用“零数据保留”（Zero Data Retention, ZDR）设置的企业级用户和特定云合作伙伴环境。

随着 Claude Fable 5 和 Claude Mythos 5 等新一代模型的推出，模型能力实现了显著提升，但也带来了潜在的安全挑战。Anthropic 指出，虽然这些模型内置了针对网络生物领域的安全护栏，但为了有效检测复杂的滥用模式（如针对特定攻击的变体测试或国家级的间谍活动），需要暂时保留提示词（Prompts）和输出内容以便进行联合分析。该政策定于 2026 年 6 月 9 日 正式生效。

核心内容

Anthropic 发布了一项新的数据保留政策，要求在使用 Mythos 系列模型及未来被指定为“受控模型”（Covered Models）时，必须保留用户提交的提示词和模型生成的输出内容，保留期限为 30 天。这一措施旨在通过信任与安全（Trust and Safety）工作，监控和识别潜在的滥用行为。

适用范围与例外情况

受影响群体：此政策仅适用于以下设置了“零数据保留”（ZDR）的组织：
- 在 Claude Console 中设置 ZDR 的工作区。
- 在 Claude Enterprise 中使用带有 ZDR 的 Claude Code。
- 通过 AWS Bedrock、Google Cloud Agent Platform 或 Microsoft Foundry 访问 Claude 且启用 ZDR 的用户。
不受影响群体：
- 消费者计划用户（包括 Claude Free、Pro 和 Max），无论是在 Web、桌面端、移动端应用，还是通过 Claude.ai 和 Claude Code 访问，均不受此更新影响。因为这些平台本身已经出于安全目的保留输入和输出数据。
- 其他所有未启用 ZDR 的组织，其现有条款保持不变。

为何需要数据保留

Anthropic 解释了这一保守策略的技术必要性：

检测复杂攻击模式：某些攻击（如 Best-of-N 越狱攻击）会发送数百个提示词的细微变体，试图找到能绕过安全护栏的那个。单独分析单个请求无法发现此类模式，必须将多个请求放在一起分析。
识别大规模滥用：国家级间谍活动或数据勒索活动等大规模滥用行为，只有当安全分类器能够“放大视角”、跨多个请求进行分析时才会显现。
模型特性：Claude Mythos 5 代表了模型能力的重大飞跃，部分能力既可善也可恶。Claude Fable 5 共享相同的底层模型，但增加了额外的安全护栏，特别是在网络和生物领域。尽管有这些护栏，Anthropic 仍采取保守方法以监控潜在的模式滥用。

数据保护措施

Anthropic 强调了对保留数据的严格保护机制：

访问限制：Anthropic 员工仅在数据被标记为可能存在严重危害，或应客户书面要求时，才能访问对话内容。
审查流程：审查只能由一小批经过批准的审查员通过专用工具进行，该工具防止导出、复制或下载数据。
审计日志：每次访问都会被记录在防篡改日志中，审查员无法抑制或修改这些日志。
自动删除：30 天后，数据会自动删除，除非它属于安全调查的一部分或法律要求保留。
额外选项：符合条件的组织可以选择添加客户管理的加密密钥（Customer-Managed Encryption Keys）和访问透明度审计日志。

配置指南

对于需要启用数据保留以使用受控模型的组织，Anthropic 提供了具体的配置路径：

通过 Anthropic API (Claude Platform)：
- 直接访问：在开发者控制台中，进入 Workspace > Manage > Privacy Controls 开启保留功能。其他启用 ZDR 的工作区保持不变。
- 通过 AWS：配置方式与直接 API 相同，在 Workspace 级别配置，数据由 Anthropic 在相同控制下处理。
- 通过 Amazon Bedrock：需要启用保留才能访问新模型，保留的数据存储在用户的 AWS 环境中。
- 通过 Google Cloud Agent Platform：需要启用保留，数据存储在 GCP 环境中。
- 通过 Azure Foundry：保留功能针对每个 Azure 订阅配置。如果当前配置了 ZDR，用户需要创建并使用一个单独的 Azure 订阅来访问这些模型。
通过 Claude Code：
- 通过 Anthropic API：数据管理遵循其运行的工作区设置。如果工作区启用了保留，Claude Code 即可使用受控模型。
- 通过 AWS Bedrock 或 Google Cloud Agent Platform：Claude Code 使用用户的云凭据，因此遵循云环境的保留设置。数据保留在提供商环境中。这也适用于通过上述平台访问的 Cowork。
- 通过 Claude Enterprise (ZDR)：Anthropic 将在管理控制台中发布新控件，允许主要所有者（Primary Owner）直接更改保留设置。如果不希望更改生产组织设置，Anthropic 可协助设置单独的沙盒组织。
通过 Claude for Enterprise 的 Chat 或 Cowork：
- 这些界面已经运行标准保留策略，因此在新模型可用时将直接获得访问权限，无需额外配置。

关键要点

政策生效时间：2026 年 6 月 9 日。
保留期限：Mythos 系列及未来指定模型的提示词和输出内容将保留 30 天。
核心目的：通过联合分析多个请求，检测 Best-of-N 越狱、国家级间谍活动等复杂或大规模的安全威胁。
用户分层：
- 消费者用户（Free/Pro/Max）：完全不受影响，因已有安全保留机制。
- 企业用户：仅影响当前启用“零数据保留”（ZDR）的高级安全设置用户。
数据安全承诺：
- 员工访问需严格审批且仅限防篡改工具。
- 所有访问行为记录在防篡改日志中。
- 30 天后自动删除，除非涉及调查或法律要求。
- 支持客户管理加密密钥和审计日志。
云厂商差异：
- AWS/Google Cloud：数据保留在用户自己的云环境中。
- Azure Foundry：若原设为 ZDR，需新建独立订阅以启用保留并访问新模型。
- Anthropic Direct/AWS Bedrock (via Platform)：数据由 Anthropic 在控制下处理。

意义与影响

Anthropic 的这一政策调整反映了 AI 行业在追求模型能力突破与保障安全合规之间的平衡尝试。

首先，明确了“零数据保留”并非绝对。对于最高级别的能力模型（Mythos 系列），Anthropic 认为出于公共安全和防止恶意滥用的需要，必须牺牲部分数据隐私承诺（即从 ZDR 变为 30 天保留）。这对于那些对数据隐私有极致要求、且依赖 ZDR 作为核心卖点的企业客户来说，是一个重要的合规性考量因素。

其次，技术上的必要性得到了解释。Anthropic 没有简单地以“安全”为由强制保留数据，而是具体指出了“Best-of-N 越狱”和“大规模模式识别”等技术原因。这表明其安全团队正在采用更主动、更复杂的检测手段，而非仅仅依赖静态的规则过滤。

最后，对云合作伙伴生态的影响。政策对不同云平台（AWS, GCP, Azure）的处理方式略有不同，特别是 Azure 要求新建订阅，这可能会增加部分用户的运维复杂度。而对于 AWS 和 GCP 用户，数据保留在用户自己的云环境中，这在一定程度上缓解了用户对 Anthropic 直接持有数据的担忧，符合企业级客户对数据主权（

查看原文 →support.claude.com