← 返回信息流
AI 资讯TechCrunch AI·7 小时前

Anthropic发布Claude Fable 5,首款面向公众的Mythos级模型

原标题:Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

速览

Anthropic正式发布了Claude Fable 5,这是其首款面向公众开放的Mythos级模型。该模型在网络安全和生物学等高风险领域设置了严格的安全护栏,以限制特定类型的响应。此举标志着Anthropic在扩大高级模型公众访问权限方面迈出了重要一步。

AI 深度解读

Anthropic Claude Fable 5 深度解读:Mythos 模型的首次公众亮相与安全边界

背景

Anthropic 正在将其最强大的 AI 模型首次推向普通公众,但这次发布伴随着严格的安全护栏(guardrails)。周二,这家 AI 公司推出了 Claude Fable 5,这是其 Mythos 模型首个面向公众可用的版本。

Mythos 模型于四月作为预览版推出,最初由于网络安全方面的担忧,仅向少数合作伙伴开放。上周,Anthropic 将访问权限扩展到了 15 个国家的数百个组织,重点仍集中在管理关键基础设施的组织上。与此同时,Anthropic 正在准备进入公开市场,与 OpenAI 和 Elon Musk 的 SpaceX 并列。在此之前,Anthropic 曾呼吁全球主要 AI 实验室建立协调的“刹车机制”,警告系统正以如此快的速度发展,可能很快实现递归自我改进(Recursive Self-Improvement, RSI),即在无人干预的情况下自主改进自身。

核心内容

Claude Fable 5 在软件工程、知识工作和视觉处理方面表现出色,但它带有硬性安全限制。在网络安全、生物学、化学和蒸馏(distillation)等高风险领域,该模型会阻止响应并回退到 Claude Opus 4.8。

访问权限与定价策略 目前,任何人都可以通过 Anthropic 的 Claude API 和基于消费量的企业计划访问该技术的某个版本。订阅访问将分阶段推出:

  • 截至 6 月 22 日,Fable 5 将免费包含在 Pro、Max、Team 和基于席位的 Enterprise 计划中。
  • 从 6 月 23 日起,Anthropic 将从这些计划中移除 Fable 5,要求后续使用消耗积分(usage credits)。公司计划尽快将其恢复为标准订阅功能。

此外,Anthropic 还向已获得高级模型访问权限的组织部署了 Mythos 的新版本,称为 Mythos 5。

安全测试与数据保留政策 鉴于对 Mythos 级模型落入错误之手可能造成的后果的担忧,Anthropic 在发布 Fable 5 之前对其分类器进行了压力测试,包括越狱尝试(jailbreak attempts)。

  • 内部测试:Anthropic 运行了一项外部漏洞赏金计划,在超过 1,000 小时的测试中未发现通用的越狱手段。
  • 外部测试:随后与外部红队组织合作,同样未能找到通用的越狱手段。

尽管如此,Anthropic 承认仍可能存在新型攻击。因此,随着 Fable 5 和 Mythos 5 的发布,Anthropic 要求对所有流量进行 30 天的保留,即使企业之前拥有零保留协议。公司表示,这些数据不会用于训练,仅用于“防御复杂和新型攻击,包括新的越狱手段”以及“识别和减少误报”。这一政策可能树立行业先例,即访问日益强大的模型将附带以安全措施为名的强制性数据保留政策。

性能表现与第三方评估 对于继续使用该模型的用户,并非每个问题都会得到 Fable 5 的回答。Anthropic 表示,Fable 必须回退到 Opus 4.8 的情况很少,早期数据显示至少 95% 的 Fable 会话完全由模型自身的响应运行。

第三方测试结果显示了 Fable 5 的强大能力:

  • Hex:分析公司 Hex 表示,Fable 是首个在其核心分析基准测试(针对复杂、长期运行的分析任务)中获得 90% 分数的模型。“在最难的问题上,它表现出强大的判断力和对细微差别的关注。”
  • Base44:Vibe-coding 平台 Base44 指出,Fable 更擅长“一次性生成完整应用”,并具有出色的工具调用能力。
  • Genspark:AI 驱动的工作区和代理平台 Genspark 表示,Fable 在其评估中击败了所有其他模型,在 UI 设计和游戏编码等任务上表现显著更好。

成本考量 Fable 5 和 Mythos 5 的定价为每百万输入 token 10 美元,每百万输出 token 50 美元,是 Opus 4.8 价格的两倍。这一价格本身可能成为广泛使用的阻碍。许多企业在看到账单或提前耗尽年度 AI 预算后,对 AI 成本日益持批评态度。像 Opus 4.8 这样的高级模型可能会加剧这些问题,因为其高级推理技能可以将单个请求拆分为多个任务。

然而,Anthropic 预计 Fable 5 的需求将非常高且难以预测。一些企业,如购物奖励平台 Rakuten,认为其收益值得这一价格。Rakuten 表示:“在最高努力级别,Fable 会反思并验证自己的工作。对我们来说,这正是实现高度自主操作的关键——额外的思考成本是值得的。”

关键要点

  • 首次公众可用:Claude Fable 5 是 Anthropic 强大的 Mythos 模型首次向公众开放,旨在平衡性能与安全。
  • 硬性安全限制:在网络安全、生物、化学等高风险领域,Fable 5 会自动回退至 Opus 4.8 或阻止响应。
  • 严格的访问过渡:6 月 22 日前免费包含在主要订阅计划中,之后转为按量计费,并计划在未来恢复为标准功能。
  • 强制性数据保留:为防御新型攻击,Anthropic 要求所有用户(包括此前有零保留协议的企业)保留 30 天流量数据,仅用于安全防御而非训练。
  • 卓越的性能基准:第三方测试显示 Fable 5 在复杂分析、UI 设计和代码生成方面表现优异,Hex 基准测试得分达 90%。
  • 高昂的成本门槛:定价是 Opus 4.8 的两倍(输入 $10/百万 token,输出 $50/百万 token),可能限制部分预算敏感型企业的广泛采用。
  • 安全验证充分:经过超过 1,000 小时的内外部红队测试,未发现通用越狱手段,但 Anthropic 仍保持警惕。

意义与影响

Claude Fable 5 的发布标志着 Anthropic 在推进前沿 AI 能力与履行安全责任之间寻求平衡的关键一步。

首先,安全与访问的制度化。Anthropic 强制实施 30 天数据保留政策,这在行业内具有开创性意义。它表明,随着模型能力的增强,访问权限不再仅仅是商业交易,而是伴随着严格的安全审计要求。这种“以安全换访问”的模式可能会成为未来高级 AI 模型的标准配置,迫使整个行业重新思考数据隐私与安全监控之间的界限。

其次,成本与价值的重新评估。Fable 5 高昂的定价策略反映了 Anthropic 对其技术价值的自信,同时也向市场发出了信号:高级推理和自主反思能力是有显著溢价的。对于像 Rakuten 这样追求高度自动化和减少人工验证成本的企业而言,这种“昂贵的思考”可能带来更高的长期运营效率。然而,对于大多数企业而言,这可能会加剧对 AI 投资回报率(ROI)的质疑,促使企业更谨慎地选择何时使用顶级模型。

最后,竞争格局的演变。在 Anthropic 准备上市、OpenAI 和 SpaceX 紧随其后的背景下,Fable 5 的发布不仅是产品迭代,更是市场地位的宣示。它展示了 Anthropic 在保持安全领先地位的同时,有能力将尖端技术商业化。然而,其严格的限制和较高的价格也可能为竞争对手留下市场空间,特别是那些在特定垂直领域提供更具性价比解决方案的公司。

查看原文 →techcrunch.com