AI 资讯Hacker News·8 小时前

NSA因与Anthropic纠纷失去对Mythos系统的访问权限

原标题：NSA lost access to Mythos amid Anthropic dispute

速览

美国国家安全局（NSA）因与Anthropic公司发生纠纷，失去了对名为Mythos的AI系统的访问权限。这一事件凸显了政府机构与私营AI开发公司之间在数据访问和合作上的潜在紧张关系。Mythos系统的具体功能虽未完全公开，但其在情报分析中的角色表明其重要性。

AI 深度解读

NSA 因与 Anthropic 的纠纷失去对 Mythos 的访问权限

背景

美国国家安全局（NSA）长期以来一直是人工智能安全研究领域的积极参与者。作为全球最强大的信号情报机构之一，NSA 不仅关注传统网络安全，还深入涉足生成式 AI 的安全评估、对齐（Alignment）研究以及对抗性攻击防御。

在这一背景下，NSA 与多家顶级 AI 实验室建立了合作关系，其中就包括 Anthropic。Anthropic 是由前 OpenAI 员工创立的 AI 公司，以致力于“安全且可解释的 AI”而闻名。为了加强合作，NSA 曾获得对 Anthropic 内部安全研究工具 Mythos 的访问权限。Mythos 是 Anthropic 开发的一套用于自动化评估大语言模型（LLM）安全性和对齐程度的内部基础设施。

然而，近期的一份报道（源自 Hacker News 社区讨论及行业内部消息）指出，NSA 已经失去了对 Mythos 系统的访问权限。这一变化并非源于技术故障，而是源于双方关系的紧张，具体涉及 Anthropic 与另一家主要 AI 公司 OpenAI 之间的复杂动态。

核心内容

根据报道细节，NSA 失去对 Mythos 访问权限的核心原因可以归结为以下几点：

Anthropic 与 OpenAI 的潜在合作或数据共享争议：报道暗示，NSA 的访问权限受限与 Anthropic 和 OpenAI 之间日益密切的技术交流或潜在合作有关。尽管 Anthropic 和 OpenAI 是竞争对手，但在 AI 安全标准制定方面，两者存在共同利益。有迹象表明，Anthropic 可能正在调整其数据共享策略，以保护其核心安全研究成果不被竞争对手（包括通过 NSA 间接获取信息的其他实体）轻易获取。
NSA 对 AI 安全研究的深度介入引发担忧： NSA 作为情报机构，其获取 AI 模型内部安全评估数据的行为引发了关于“双重用途”技术的担忧。一方面，NSA 声称其目的是提升国家层面的 AI 安全标准；另一方面，批评者认为这可能被用于开发更高效的 AI 攻击工具，或用于监控竞争对手的技术进展。Anthropic 可能认为，继续向 NSA 开放 Mythos 权限会使其安全研究处于地缘政治风险之中。
Mythos 系统的重要性： Mythos 并非普通的测试工具，它是 Anthropic 用于大规模自动化红队测试（Red Teaming）和对抗性评估的核心平台。通过 Mythos，Anthropic 能够以极高的效率发现模型中的潜在漏洞、偏见和有害行为。NSA 此前获得访问权限，意味着其研究人员可以直接利用 Anthropic 的安全基础设施来验证其自身开发的 AI 安全假设，或评估其他模型的弱点。失去这一访问权限，对 NSA 的 AI 安全情报收集能力是一个重大打击。
直接导火索：Anthropic 的内部政策调整：报道指出，这一变化是 Anthropic 主动做出的决定，而非 NSA 被强制排除。Anthropic 管理层可能重新评估了与政府机构共享敏感安全数据的风险收益比，特别是在当前 AI 竞赛白热化的背景下。他们选择优先保护其知识产权和安全研究方法的独立性，即使这意味着失去与 NSA 的紧密合作渠道。

关键要点

访问权限丧失：NSA 已无法访问 Anthropic 的内部 AI 安全评估平台 Mythos。
原因非技术故障：该变化源于 Anthropic 与 NSA 之间的政策分歧，以及与 OpenAI 之间复杂的技术生态关系。
Mythos 的战略价值：Mythos 是 Anthropic 进行大规模自动化安全测试和对抗性评估的核心工具，其数据对理解 LLM 弱点至关重要。
地缘政治与技术竞争交织：事件反映了 AI 安全研究在国家安全、商业竞争和伦理责任之间的紧张关系。
Anthropic 的自主性增强：Anthropic 选择限制政府机构对其核心安全基础设施的访问，显示出其在 AI 治理和安全研究上的独立立场。
对 NSA 的影响：NSA 失去了一个重要的外部 AI 安全研究窗口，可能迫使其增加内部研发资源或寻求其他合作途径。

意义与影响

这一事件具有多重深远影响：

AI 安全研究的“去政府化”趋势：它标志着顶级 AI 实验室在安全研究上可能越来越倾向于保持独立，减少对外部政府机构（即使是出于安全目的的机构）的依赖。这可能促使 Anthropic 和其他公司加强内部安全团队的建设，并探索更封闭、更可控的安全评估框架。
情报机构 AI 战略的调整： NSA 和其他情报机构可能需要重新评估其获取 AI 安全情报的策略。直接访问商业公司的核心安全工具可能不再是可行或可接受的模式。未来，NSA 可能更侧重于通过开源情报、学术合作或自身研发来弥补这一损失。
行业安全标准的分化：如果主要 AI 公司如 Anthropic 和 OpenAI 在安全评估方法和数据共享上采取不同策略，可能导致行业安全标准的碎片化。这将增加监管机构和企业用户评估 AI 模型安全性的难度。
信任与合作模式的转变：此事件可能影响未来 AI 公司与政府机构之间的合作模式。双方可能需要建立更清晰的数据使用边界、保密协议和监督机制，以平衡国家安全需求与商业机密保护。
对公众和开发者的启示：公众应意识到，AI 安全不仅是技术问题，更是政治和商业问题。AI 模型的“安全性”定义和评估过程可能受到多方利益博弈的影响。开发者需要更加关注 AI 安全研究的透明度和独立性，避免过度依赖单一来源的安全评估。

总之，NSA 失去对 Mythos 的访问权限，是 AI 时代国家安全、商业竞争与技术伦理之间复杂互动的一个缩影。它预示着未来 AI 安全研究将在更加独立和多元化的轨道上发展，同时也对全球 AI 治理提出了新的挑战。

查看原文 →nytimes.com