← 返回信息流
AI 资讯TechCrunch AI·2 小时前4 源报道

Anthropic发布Claude Fable 5,首款面向公众的Mythos级模型

原标题:Anthropic’s Claude Fable is a version of Mythos the public can access today

速览

Anthropic正式发布Claude Fable 5,这是其首款面向公众开放的Mythos级模型。该模型在网络安全和生物学等高风险领域内置了严格的安全护栏,以限制潜在有害的响应。此举标志着Anthropic在将高级AI能力推向大众市场方面迈出了重要一步。

AI 深度解读

Anthropic 发布 Claude Fable 5:Mythos 模型的公众版与安全边界

背景

Anthropic 正在将其最强大的 AI 模型首次面向公众开放,但这次发布伴随着严格的“护栏”机制。周二,这家 AI 公司推出了 Claude Fable 5,这是其 Mythos 模型系列中首个可供公众使用的版本。

此前,Mythos 模型于 4 月以预览版形式推出,但由于网络安全方面的担忧,最初仅向少数合作伙伴开放。上周,Anthropic 将访问权限扩展到了 15 个国家的数百家组织,重点仍集中在管理关键基础设施的企业上。

此次 Claude Fable 5 的发布,正值 Anthropic 准备进入公开市场之际,与此同时,OpenAI 和埃隆·马斯克(Elon Musk)旗下的 SpaceX 也在筹备上市。此外,这一举动紧随 Anthropic 此前呼吁全球主要 AI 实验室为前沿 AI 发展建立“协调刹车机制”之后。Anthropic 警告称,系统的发展速度极快,可能很快实现递归自我改进(Recursive Self-Improvement, RSI),即在没有人类干预的情况下自主提升自身能力。

鉴于 Mythos 级模型若落入错误之手可能带来的风险,Anthropic 在发布 Fable 5 之前对其分类器进行了压力测试,包括尝试各种“越狱”(jailbreak)攻击。

核心内容

Claude Fable 5 被定位为 Mythos 模型的公众可访问版本。Anthropic 表示,该模型在软件工程、知识工作和视觉处理方面表现出色,但在高风险领域设有硬性安全限制。

安全限制与降级机制

在网络安全、生物学、化学以及模型蒸馏(distillation)等高风险领域,Fable 5 会阻止生成响应,并自动回退至 Claude Opus 4.8。Anthropic 指出,Fable 5 必须将任务委托给 Opus 4.8 的情况很少,早期数据显示,至少 95% 的 Fable 会话完全由模型自身的响应处理。

访问权限与定价策略

目前,任何用户都可以通过 Anthropic 的 Claude API 和基于消耗的 Enterprise 计划使用 Fable 5。订阅用户的访问权限将分阶段推出:

  • 6 月 22 日之前Fable 5 将免费包含在 ProMaxTeam 以及基于席位的 Enterprise 计划中。
  • 6 月 23 日起:Anthropic 将从上述计划中移除 Fable 5,此后使用需要消耗积分(usage credits)。公司计划尽快将其恢复为标准订阅功能。

同时,Anthropic 还向已获准访问该先进模型的组织部署了 Mythos 5 的新版本。

数据保留与安全政策

为了防止复杂和新型的攻击(包括新的越狱尝试),并识别和减少误报,Anthropic 宣布在 Fable 5Mythos 5 发布后,将对所有流量实施 30 天的数据保留政策。即使企业之前拥有零数据保留协议,也必须遵守此规定。Anthropic 强调,这些数据仅用于防御攻击,不会用于模型训练。这一政策可能树立行业先例,即访问日益强大的模型需附带以安全措施为名的强制数据保留政策。

性能评估

在第三方测试中,Fable 5 展现了强劲的性能:

  • Hex(分析公司):在复杂、长时间运行的分析任务核心基准测试中,Fable 是首个获得 90% 分数的模型。Hex 指出:“在最难的问题上,它显示出强大的判断力和对细微差别的关注。”
  • Base44(Vibe-coding 平台):指出 Fable 更擅长“一次性生成完整应用”,并具有出色的工具调用能力。
  • Genspark(AI 驱动的工作区和代理平台):称 Fable 在其评估中击败了所有其他模型,在 UI 设计和游戏编码等任务上表现显著更好。

成本考量

Fable 5Mythos 5 的定价为每百万输入 token 10 美元,每百万输出 token 50 美元,是 Opus 4.8 价格的两倍。这一价格本身可能对广泛使用构成阻碍。许多企业在看到账单或提前耗尽年度 AI 预算后,对 AI 成本日益持批评态度。Opus 4.8 等高级模型因其高级推理能力(可将单个请求拆分为多个任务)而加剧了这一问题。

尽管 Anthropic 预计 Fable 5 的需求将非常高且难以预测,但部分企业认为其价值值得付出高价。Rakuten(购物奖励平台)表示:“在最高努力模式下,Fable 会反思并验证自己的工作。对我们来说,这正是实现高度自主操作的关键——额外的思考成本是值得的。”

关键要点

  • 模型定位Claude Fable 5Mythos 模型的公众版,专注于软件工程、知识工作和视觉任务,但在高风险领域(如网络安全、生物、化学)会降级至 Claude Opus 4.8
  • 安全测试:Anthropic 在发布前进行了超过 1000 小时的外部漏洞赏金测试和外部红队测试,未发现通用的越狱方法,但仍实施了严格的 30 天数据保留政策以防御新型攻击。
  • 访问变化:6 月 22 日前,Fable 5 在多个订阅计划中免费;6 月 23 日起,将转为按使用量计费(消耗积分),直到公司决定将其恢复为标准订阅功能。
  • 性能表现:第三方测试显示 Fable 5 在复杂分析任务中得分高达 90%,在代码生成、UI 设计和工具调用方面表现优于其他模型。
  • 高昂成本:定价为输入 10 美元/百万 token,输出 50 美元/百万 token,是 Opus 4.8 的两倍,旨在通过价格杠杆控制使用并反映其高级推理能力带来的资源消耗。
  • 行业背景:此次发布正值 Anthropic 筹备上市及呼吁建立 AI 发展“刹车机制”之际,反映了公司对前沿 AI 快速进步(如递归自我改进)的谨慎态度。

意义与影响

Claude Fable 5 的发布标志着 Anthropic 在平衡前沿 AI 能力普及与安全控制方面迈出了重要一步。

首先,安全与开放的博弈。Anthropic 没有选择完全开放 Mythos 模型,而是通过“护栏”和降级机制,在提供强大能力的同时限制了其在高风险领域的应用。这种“硬安全限制”结合 30 天数据保留政策,可能成为行业新标准,即访问顶级模型需以牺牲部分隐私(数据保留)为代价换取安全性。

其次,成本结构的调整。两倍于 Opus 4.8 的定价策略,一方面反映了 Mythos 级模型在推理能力和安全性上的更高成本,另一方面也起到了筛选用户的作用,确保只有真正需要其高级能力(如高度自主操作)的企业才会承担这一费用。Rakuten 的案例表明,对于追求极致自主性和准确性的场景,用户愿意为“额外的思考”付费。

最后,行业趋势的预示。在 Anthropic 呼吁建立 AI 发展“刹车”的背景下,Fable 5 的发布展示了头部 AI 公司如何在追求技术领先的同时,试图通过技术手段(如分类器、数据监控)和商业模式(如分级访问、高价策略)来管理潜在风险。这不仅影响了 Anthropic 自身的市场策略,也可能迫使竞争对手重新评估其模型发布的安全标准和定价模型。

查看原文 →techcrunch.com