Anthropic发布Claude Fable 5,首款面向公众的Mythos级模型
速览
Anthropic正式发布Claude Fable 5,这是其首款面向公众开放的Mythos级模型。该模型在网络安全和生物学等高风险领域内置了严格的安全护栏,以限制潜在有害的响应。此举标志着Anthropic在将高级AI能力推向大众市场方面迈出了重要一步。
AI 深度解读
Anthropic 发布 Claude Fable 5:Mythos 模型的公众版与安全边界
背景
Anthropic 正在将其最强大的 AI 模型首次面向公众开放,但这次发布伴随着严格的“护栏”机制。周二,这家 AI 公司推出了 Claude Fable 5,这是其 Mythos 模型系列中首个可供公众使用的版本。
此前,Mythos 模型于 4 月以预览版形式推出,但由于网络安全方面的担忧,最初仅向少数合作伙伴开放。上周,Anthropic 将访问权限扩展到了 15 个国家的数百家组织,重点仍集中在管理关键基础设施的企业上。
此次 Claude Fable 5 的发布,正值 Anthropic 准备进入公开市场之际,与此同时,OpenAI 和埃隆·马斯克(Elon Musk)旗下的 SpaceX 也在筹备上市。此外,这一举动紧随 Anthropic 此前呼吁全球主要 AI 实验室为前沿 AI 发展建立“协调刹车机制”之后。Anthropic 警告称,系统的发展速度极快,可能很快实现递归自我改进(Recursive Self-Improvement, RSI),即在没有人类干预的情况下自主提升自身能力。
鉴于 Mythos 级模型若落入错误之手可能带来的风险,Anthropic 在发布 Fable 5 之前对其分类器进行了压力测试,包括尝试各种“越狱”(jailbreak)攻击。
核心内容
Claude Fable 5 被定位为 Mythos 模型的公众可访问版本。Anthropic 表示,该模型在软件工程、知识工作和视觉处理方面表现出色,但在高风险领域设有硬性安全限制。
安全限制与降级机制
在网络安全、生物学、化学以及模型蒸馏(distillation)等高风险领域,Fable 5 会阻止生成响应,并自动回退至 Claude Opus 4.8。Anthropic 指出,Fable 5 必须将任务委托给 Opus 4.8 的情况很少,早期数据显示,至少 95% 的 Fable 会话完全由模型自身的响应处理。
访问权限与定价策略
目前,任何用户都可以通过 Anthropic 的 Claude API 和基于消耗的 Enterprise 计划使用 Fable 5。订阅用户的访问权限将分阶段推出:
- 6 月 22 日之前:Fable 5 将免费包含在 Pro、Max、Team 以及基于席位的 Enterprise 计划中。
- 6 月 23 日起:Anthropic 将从上述计划中移除 Fable 5,此后使用需要消耗积分(usage credits)。公司计划尽快将其恢复为标准订阅功能。
同时,Anthropic 还向已获准访问该先进模型的组织部署了 Mythos 5 的新版本。
数据保留与安全政策
为了防止复杂和新型的攻击(包括新的越狱尝试),并识别和减少误报,Anthropic 宣布在 Fable 5 和 Mythos 5 发布后,将对所有流量实施 30 天的数据保留政策。即使企业之前拥有零数据保留协议,也必须遵守此规定。Anthropic 强调,这些数据仅用于防御攻击,不会用于模型训练。这一政策可能树立行业先例,即访问日益强大的模型需附带以安全措施为名的强制数据保留政策。
性能评估
在第三方测试中,Fable 5 展现了强劲的性能:
- Hex(分析公司):在复杂、长时间运行的分析任务核心基准测试中,Fable 是首个获得 90% 分数的模型。Hex 指出:“在最难的问题上,它显示出强大的判断力和对细微差别的关注。”
- Base44(Vibe-coding 平台):指出 Fable 更擅长“一次性生成完整应用”,并具有出色的工具调用能力。
- Genspark(AI 驱动的工作区和代理平台):称 Fable 在其评估中击败了所有其他模型,在 UI 设计和游戏编码等任务上表现显著更好。
成本考量
Fable 5 和 Mythos 5 的定价为每百万输入 token 10 美元,每百万输出 token 50 美元,是 Opus 4.8 价格的两倍。这一价格本身可能对广泛使用构成阻碍。许多企业在看到账单或提前耗尽年度 AI 预算后,对 AI 成本日益持批评态度。Opus 4.8 等高级模型因其高级推理能力(可将单个请求拆分为多个任务)而加剧了这一问题。
尽管 Anthropic 预计 Fable 5 的需求将非常高且难以预测,但部分企业认为其价值值得付出高价。Rakuten(购物奖励平台)表示:“在最高努力模式下,Fable 会反思并验证自己的工作。对我们来说,这正是实现高度自主操作的关键——额外的思考成本是值得的。”
关键要点
- 模型定位:Claude Fable 5 是 Mythos 模型的公众版,专注于软件工程、知识工作和视觉任务,但在高风险领域(如网络安全、生物、化学)会降级至 Claude Opus 4.8。
- 安全测试:Anthropic 在发布前进行了超过 1000 小时的外部漏洞赏金测试和外部红队测试,未发现通用的越狱方法,但仍实施了严格的 30 天数据保留政策以防御新型攻击。
- 访问变化:6 月 22 日前,Fable 5 在多个订阅计划中免费;6 月 23 日起,将转为按使用量计费(消耗积分),直到公司决定将其恢复为标准订阅功能。
- 性能表现:第三方测试显示 Fable 5 在复杂分析任务中得分高达 90%,在代码生成、UI 设计和工具调用方面表现优于其他模型。
- 高昂成本:定价为输入 10 美元/百万 token,输出 50 美元/百万 token,是 Opus 4.8 的两倍,旨在通过价格杠杆控制使用并反映其高级推理能力带来的资源消耗。
- 行业背景:此次发布正值 Anthropic 筹备上市及呼吁建立 AI 发展“刹车机制”之际,反映了公司对前沿 AI 快速进步(如递归自我改进)的谨慎态度。
意义与影响
Claude Fable 5 的发布标志着 Anthropic 在平衡前沿 AI 能力普及与安全控制方面迈出了重要一步。
首先,安全与开放的博弈。Anthropic 没有选择完全开放 Mythos 模型,而是通过“护栏”和降级机制,在提供强大能力的同时限制了其在高风险领域的应用。这种“硬安全限制”结合 30 天数据保留政策,可能成为行业新标准,即访问顶级模型需以牺牲部分隐私(数据保留)为代价换取安全性。
其次,成本结构的调整。两倍于 Opus 4.8 的定价策略,一方面反映了 Mythos 级模型在推理能力和安全性上的更高成本,另一方面也起到了筛选用户的作用,确保只有真正需要其高级能力(如高度自主操作)的企业才会承担这一费用。Rakuten 的案例表明,对于追求极致自主性和准确性的场景,用户愿意为“额外的思考”付费。
最后,行业趋势的预示。在 Anthropic 呼吁建立 AI 发展“刹车”的背景下,Fable 5 的发布展示了头部 AI 公司如何在追求技术领先的同时,试图通过技术手段(如分类器、数据监控)和商业模式(如分级访问、高价策略)来管理潜在风险。这不仅影响了 Anthropic 自身的市场策略,也可能迫使竞争对手重新评估其模型发布的安全标准和定价模型。
