AI 资讯The Verge AI·21 小时前

AI危险谁定？Anthropic模型遭美出口管制下架

原标题：Who decides when AI is too dangerous?

速览

Anthropic发布的AI模型Fable 5及底层Mythos模型遭美国政府实施出口管制，导致Anthropic被迫将其全面下架。这一事件引发了关于AI安全边界、政府监管权力以及企业合规困境的广泛争议。尽管Anthropic长期呼吁加强AI监管，但此次实际遭遇的强硬措施令其陷入被动，并引发全球对美AI监管走向的关注。

AI 深度解读

谁来决定 AI 何时过于危险？——Anthropic 与特朗普政府的监管博弈

背景

近期，AI 领域发生了一场极具戏剧性的监管冲突，核心围绕 Anthropic 公司及其最新发布的 AI 模型 Fable 5 展开。这不仅是 Anthropic 首次直面特朗普政府新的 AI 监管框架，也暴露了美国政府在 AI 安全与出口管制方面的混乱与不确定性。

事件起因于 Anthropic 在发布其强大的底层模型 Mythos 5 及其面向公众的简化版 Fable 5 后不久，美国政府对这两个模型实施了出口管制，禁止外国国民（包括在美国工作的 Anthropic 员工）访问。Anthropic 随后被迫将 Fable 和 Mythos 全面下线，理由是担心无法在技术上合规地限制访问权限。这一系列操作导致了一场从周五开始、持续整个周末乃至随后的“混乱”，引发了科技界、政策制定者以及全球观察者的高度关注。

核心内容

模型关系与命名困惑

要理解此次事件，首先需要厘清 Anthropic 的模型架构。Anthropic 的命名方式常被外界诟病为混乱，但此次事件涉及两个关键模型：

Mythos 5：这是 Anthropic 的底层基础模型。此前在 4 月发布过预览版（Mythos Preview），当时 Anthropic 将其描述为潜在的“网络武器”，强调其危险性，仅向企业和政府等“网络防御者”开放，直到安全措施跟上。Mythos 5 是该系列的首个正式版本。
Fable 5：这是基于 Mythos 5 框架构建的、面向公众发布的版本。它并非迭代式发布（如 Fable 1-4），而是直接以“5”命名。Fable 5 本质上是带有严格安全护栏（guardrails）的 Mythos 5 版本，旨在防止公众访问这一被 Anthropic 自认为“极度危险”的模型。

监管突袭与合规困境

事件的关键转折点发生在上周周五。尽管 Anthropic 此前大力宣扬 Mythos 系列的危险性，并声称已建立足够的安全措施，但美国政府突然宣布对 Fable 5 及其底层模型 Mythos 5 实施出口管制。

管制措施：禁止外国国民访问这些模型，即使这些人员是在美国境内为 Anthropic 工作。
Anthropic 的反应：由于无法在技术上确保能完全阻断外国国民的访问，Anthropic 选择主动将 Fable 和 Mythos 从所有用户中下线，以履行合规义务。

“越狱”争议与红队测试

在模型发布初期，社区对 Fable 5 的安全护栏存在争议。AI 和安全研究人员发现，这些护栏过于严格，甚至阻碍了正常的研究工作——一旦研究人员尝试突破边界，模型就会降级回退到 Anthropic 的旧版本。这曾一度成为网络迷因（meme），人们嘲笑其护栏的僵化。

然而，在出口管制消息传出前，多位独立红队测试员（red teamers）对 Anthropic 表示，Fable 5 的安全护栏表现相当稳固，他们尝试了多种方法均未成功“越狱”。这与通常红队测试员能轻易找到漏洞的经验不同。

政治介入与时间线

据知情人士透露，事件的爆发源于亚马逊（Amazon）的研究发现。

亚马逊的发现：亚马逊研究人员发现了一种潜在的“越狱”方法，对此感到担忧。
内部沟通：亚马逊将这一发现告知 Anthropic，双方就其严重性进行了讨论。
高层介入：亚马逊 CEO 安迪·贾西（Andy Jassy）对此事感到担忧，并于周五联系了特朗普政府成员（据报道可能是财政部长 Scott Bessent 或其他官员），表达了对 AI 安全风险的关切。
政府行动：随后，美国政府迅速采取行动，实施了出口管制。

讽刺与现状

这一事件充满了讽刺意味。Anthropic 多年来一直游说政府，认为 AI 即将变得过于强大且危险，呼吁政府尽早采取严肃的监管措施。如今，当监管真正来临时，Anthropic 却对这种突如其来的、缺乏明确标准的干预感到不满。

截至录音周二，Fable 5 仍处于离线状态。Claude 聊天窗口甚至直接提示用户“Fable 5 当前不可用”。

关键要点

监管的不确定性：美国政府对 AI 的监管方式显得混乱且缺乏透明度。周五突然出台管制措施，周末各方紧急磋商，周一仍无明确解决方案，显示出政策执行层面的“周五效应”和应急状态。
出口管制的广泛性：新的出口管制不仅针对海外用户，还波及在美国工作的外国籍员工，这给跨国 AI 公司的运营带来了巨大的合规挑战。
安全护栏的双刃剑：Anthropic 建立的严格安全护栏虽然被红队测试员认为能有效防止越狱，但也引发了研究界的抱怨，且在政治压力下，这些护栏并未能阻止政府将其视为潜在威胁。
政治化风险：事件引发了外界对 AI 监管是否会被政治化的担忧。人们担心美国的 AI 监管框架可能不会成为严肃的安全标准，而是沦为白宫针对不听话公司或个人的政治武器。
全球观察视角：特别是中国政府，正在密切关注美国如何处理此次危机。美国是建立一个严肃的 AI 安全框架，还是将其作为地缘政治斗争的工具，将影响全球 AI 治理格局。

意义与影响

1. 对 Anthropic 及科技行业的冲击

此次事件标志着 Anthropic 从“监管倡导者”转变为“监管受害者”。它揭示了即使是最注重安全的 AI 公司，在面对政府突然且模糊的监管指令时，也显得脆弱无力。对于整个科技行业而言，这增加了政策风险，使得公司在发布前沿模型时面临不可预测的合规障碍。

2. 美国 AI 监管框架的信誉危机

特朗普政府此次的处理方式——缺乏事前沟通、执行仓促、标准模糊——损害了美国 AI 监管的可预测性和专业性。如果监管被视为一种政治武器而非基于科学的安全评估，将削弱国际社会对美国主导的 AI 治理标准的信任。

3. 全球 AI 治理的分化风险

如果美国未能建立起清晰、公正且基于安全的监管框架，其他国家（尤其是中国）可能会采取不同的路径。这可能加剧全球 AI 技术的分裂，形成不同的技术标准和生态体系，阻碍全球范围内的 AI 安全合作与技术交流。

4. “安全”定义的重新审视

事件迫使业界重新思考“安全”的定义。Anthropic 认为其模型已足够安全，但政府基于潜在的地缘政治风险（如亚马逊发现的漏洞）将其列为管制对象。这表明，AI 的安全不仅关乎技术层面的“越狱”风险，更关乎其在国际竞争中的战略价值。未来的监管将不得不平衡技术创新、国家安全与全球合作之间的复杂关系。

5. 长期影响：监管常态化与博弈加剧

随着新模型的不断发布，此类冲突可能成为常态。AI 公司需要在技术创新与政治合规之间寻找微妙的平衡，而政府则需要建立更透明、更专业的监管机制，以避免因随意干预而扼杀创新或引发国际争端。此次事件只是这一漫长博弈的开始，其后续发展将对未来几年的 AI 产业格局产生深远影响。

查看原文 →theverge.com