AI 资讯The Verge AI·2 小时前

Anthropic发布首款Mythos级模型Claude Fable 5

原标题：Anthropic releases its first Mythos-class model Claude Fable

速览

Anthropic正式发布了其首款Mythos系列AI模型Claude Fable 5，并宣称这是该公司迄今最强且广泛可用的模型。该模型在软件工程、知识工作和视觉任务中展现出卓越性能，且随着任务复杂度增加优势愈发明显。此前Anthropic因Mythos系列在网络安全任务中过于强大而存在安全风险，此次发布得益于新引入的高风险领域响应拦截等安全护栏机制。

AI 深度解读

Anthropic 发布首款 Mythos 级模型 Claude Fable 5：安全与能力的平衡术

Anthropic 正式宣布推出 Claude Fable 5，这是该公司迄今为止向公众开放的最强大 AI 模型。这一发布标志着 Anthropic 的 Mythos 系列模型首次大规模面世，同时也揭示了该公司在应对高能力模型潜在风险时所采取的新策略。

背景

此前，Anthropic 曾明确表示，其 Mythos 系列 AI 模型在网络安全等领域的表现过于强大，以至于被认为过于危险，不适合向公众发布。然而，随着安全技术的进步，Anthropic 认为现在有条件将这一级别的模型推向市场。

此次发布的 Claude Fable 5 是 Anthropic Mythos 系列的首次广泛发布。该系列模型因其卓越的性能而闻名，但也因潜在的高风险而备受争议。为了平衡能力与安全，Anthropic 引入了新的安全护栏机制，旨在阻止模型在特定高风险领域生成响应。

核心内容

1. 性能表现与定位 Anthropic 表示，Claude Fable 5 在软件工程、知识工作和视觉处理方面表现出卓越的性能。随着任务长度和复杂度的增加，Fable 5 相对于其他模型的优势愈发明显。它被定义为 Anthropic 目前最强大的公开可用模型。

2. 安全机制与降级策略 为了缓解此前认为“过于危险”的顾虑，Anthropic 为 Fable 5 部署了新的安全护栏。这些护栏专门针对网络安全和生物学等敏感领域，旨在阻止模型在这些高风险区域生成响应。

降级机制：当触发安全护栏时，系统会自动回退到 Claude Opus 4.8。Anthropic 在上月发布 Opus 4.8 时曾称赞其具有极高的“诚实性”。
运行效率：公司在测试中指出，95% 的 Fable 会话完全由 Fable 模型处理，无需回退到 Opus 4.8，表明新模型在大多数场景下能独立运行。

3. Claude Mythos 5 的发布与访问限制 Anthropic 同时发布了 Claude Mythos 5，但提供的细节极少。

模型关系：根据官方博客，Mythos 5 与 Fable 5 基于相同的底层模型，但“移除了部分领域的安全护栏”。
访问权限：目前，Mythos 5 的访问权限似乎仅限于通过 Anthropic 的私有项目 Glasswing 获得访问权限的组织。这是一个逐步扩大的群体，这些用户将能够升级到 Mythos 5。
未来计划：Anthropic 表示，计划通过更系统的“受信任访问计划”逐步扩大访问权限。

4. 定价策略 两款新模型的定价显著高于其前代旗舰模型 Claude Opus 4.8：

Fable 5 定价：每百万输入 token 10 美元，每百万输出 token 50 美元。
对比：这一价格是 Opus 4.8 的两倍，但仅为 Mythos Preview 用户当前支付价格的一半。

5. 未解之谜 Anthropic 未就以下问题公开回应：

新模型与之前的 Claude Mythos Preview 具体有何关系？
既然此前没有发布过任何 Mythos 或 Fable 模型，为何将新模型编号为“5”？

关键要点

首款公开 Mythos 模型：Claude Fable 5 是 Anthropic Mythos 系列首次向公众广泛发布，打破了此前因安全风险而拒绝公开的计划。
动态安全护栏：引入的新安全机制可在网络安全和生物学等敏感领域拦截响应，并自动降级至更保守的 Claude Opus 4.8 模型，以平衡能力与安全。
Mythos 5 的封闭性：Claude Mythos 5 与 Fable 5 同源，但去除了部分安全限制，目前仅对通过 Glasswing 项目获得许可的组织开放，属于“预览版”性质的受限访问。
性能优势随复杂度提升：Fable 5 在软件工程、知识工作和视觉任务中表现优异，且在长上下文和复杂任务中优势更加明显。
高价策略：Fable 5 的定价是 Opus 4.8 的两倍，反映了其作为最新旗舰模型的地位，但仍低于此前 Mythos Preview 的内部测试价格。
命名与版本疑问：Anthropic 未解释“Fable”和“5”的命名逻辑，以及其与之前预览版模型的具体迭代关系。

意义与影响

1. 安全与能力的平衡范式 Anthropic 此次发布展示了大型语言模型（LLM）发展中一个关键转折点：如何在释放模型极致能力的同时，通过技术手段（如动态降级和安全护栏）管理其潜在风险。通过引入“回退”机制，Anthropic 试图向公众和监管机构证明，即使是高风险的 Mythos 级模型，也可以在受控环境下安全使用。

2. 分层访问策略的深化 通过区分 Fable 5（公开但受限）和 Mythos 5（封闭且限制更少），Anthropic 建立了一种分层访问模式。这种策略允许公司在扩大用户基础的同时，保留对最高能力模型的严格控制，直到建立起更完善的信任体系。这反映了 AI 行业从“全面开放”向“分级信任”过渡的趋势。

3. 市场竞争格局变化 Claude Fable 5 的性能定位直接挑战了当前市场上的其他顶级模型。其在软件工程等垂直领域的卓越表现，可能使其成为开发者和企业用户的首选，尤其是在处理复杂任务时。然而，其高昂的定价也可能限制其在价格敏感型市场中的普及。

4. 透明度与信任的挑战 Anthropic 未对模型编号和命名逻辑做出解释，这可能在一定程度上引发外界对其产品路线图透明度的质疑。在 AI 行业日益关注模型可解释性和安全性的背景下，保持清晰的沟通对于维持用户信任至关重要。

5. 对行业标准的潜在影响 如果 Anthropic 的安全护栏机制被证明有效且不影响核心性能，可能会为其他 AI 公司提供一种参考范式，即在发布高能力模型时，如何通过技术手段而非单纯的限制来管理风险。这可能推动整个行业在安全标准和技术实现上的进一步演进。

查看原文 →theverge.com