Anthropic发布Claude Fable 5,Token计费时代来临
速览
Anthropic发布Claude Fable 5,这是首个面向公众开放的Mythos级模型,在软件工程、视觉理解等任务中表现卓越。该模型将从6月23日起不再包含在订阅计划中,转为按Token消耗计费,标志着AI进入Token计费时代。尽管能力强大,但涉及网络安全、生物化学等高风险领域时会自动降级至Opus 4.8,且高昂的Token成本对普通用户构成挑战。
AI 深度解读
背景
Anthropic 近期发布了其史上最强模型系列:Claude Fable 5 和 Claude Mythos 5。这一发布不仅标志着模型能力的重大突破,更预示着 AI 行业计费模式与使用门槛的根本性转变。
其中,Claude Fable 5 是首个面向公众开放的 Mythos 级模型,而 Claude Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。这一分级策略旨在平衡前沿能力的开放与潜在的高风险滥用。
此次发布最引人注目的变化在于计费模式的调整。从 6 月 22 日起,Fable 5 将从 Pro、Max、Team 和按席位计费的 Enterprise 订阅计划中移除。在此之前,用户无需额外付费即可使用;在此之后,继续使用 Fable 5 将需要消耗 usage credits(用量积分)。这意味着过去“一张月卡解锁最强 AI”的模式即将终结,AI 正从一种近似包月的服务,转变为按量消耗的生产资料。
核心内容
1. 模型定位与命名由来 Anthropic 对 Fable 和 Mythos 的命名源自拉丁语和希腊语,分别意为“被讲述的小故事”和“神话/叙事”。两者实际基于同一底层模型,但 Fable 5 面向公众,带有更严格的安全限制;Mythos 5 则通过 Project Glasswing 计划提供给特定机构。Fable 5 被官方定义为目前一般可用模型中能力最强的一款,在软件工程、知识工作、视觉理解和科学研究等领域均有显著提升,且任务越长、越复杂,其相对于此前 Claude 模型的优势越大。
2. 核心能力突破
- 软件工程:这是官方最强调的方向。Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务,原本需工程团队耗时两个多月,Fable 5 在一天内完成。Cognition 的 FrontierCode 测试也显示其在复杂生产级代码任务中表现领先。
- 知识工作:在 Hebbia 的金融基准测试中取得最高成绩,提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测显示其在事实检索、概念推理等方面表现强劲。
- 视觉理解:能从复杂科学图表中提取精确数字,或根据网页截图重建应用源码。官方展示案例中,Fable 5 仅依靠游戏画面即完成了《宝可梦火红》的通关,无需额外地图或导航工具。
- 长上下文与记忆:在《杀戮尖塔》测试中,提供持久化文件记忆后,Fable 5 的表现提升幅度是 Opus 4.8 的三倍,进入最终章节的频率也提升三倍。
- 生命科学:Mythos 5 在内部测试中将部分药物设计流程加速约 10 倍,在 14 个蛋白靶点中成功产生了 9 个值得继续研究的候选方案。
3. 安全限制与模型回退机制 为了防止高风险能力的滥用,Fable 5 配套了一套新的安全分类器。当用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向时,系统会自动将请求回退至 Claude Opus 4.8 处理,并告知用户模型发生了变化。
- 网络安全:Mythos 级模型擅长发现和利用软件漏洞,具备代理式攻击能力,因此 Fable 5 对此类请求限制极严。
- 生物与化学:鉴于模型已具备完成真实科学任务的能力,Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8。
- 前沿模型开发保护:Anthropic 加入了一层隐藏保护,限制 Claude 协助构建预训练流水线、分布式训练基础设施等任务。这类保护不提示用户,而是通过提示词修改或降低性能来实施。
4. 定价与成本结构 Fable 5 和 Mythos 5 的 API 定价相同:每百万输入 token 10 美元,每百万输出 token 50 美元。虽然这低于 Claude Mythos Preview 的一半,但对于高强度长任务而言,成本依然高昂。
- 订阅制终结:6 月 23 日后,Fable 5 不再包含在常规订阅中,需单独购买 usage credits。
- 实测成本警示:作为 20 美元套餐的 Pro 用户,仅运行几个简单任务即可耗尽额度。高强度长任务(如重构 5000 万行代码、独立开发完整应用)将产生巨额 token 消耗。
5. 实测表现与评价
- 能力展示:实测显示 Fable 5 已能识别 6 根手指(此前 AI 模型的常见短板)。在高考语文作文题中表现流畅;在小行星可视化任务中,能设计包含轨道轨迹的交互式展示;在健身度假村规划中,能综合考虑人流动线和功能分布。
- 开发者反馈:前特斯拉 AI 总监、Anthropic 员工 Andrej Karpathy 对其能力表示认可。沃顿商学院教授 Ethan Mollick 的实测显示,Fable 5 能构建基于真实交通数据的交互式地图,并连续工作 9.5 小时开发出一款研究工具 Concord。
- 局限性:Mollick 指出 Fable 5 仍会出现错误和遗漏,需人工检查。此外,其设计审美目前仍略逊于人类。
关键要点
- 计费模式巨变:6 月 23 日起,Claude Fable 5 将从 Pro/Max/Team/Enterprise 订阅计划中移除,转为按 usage credits 计费,标志着“包月制”最强 AI 时代的结束。
- 分级开放策略:Fable 5 面向公众,Mythos 5 面向特定机构(网络安全、生物医学等)。Mythos 级能力首次大规模向普通用户开放,但伴随严格的安全限制。
- 高风险领域回退:涉及网络安全、生物、化学及模型蒸馏的请求,Fable 5 会自动回退至 Claude Opus 4.8 处理,以控制风险。
- 隐藏的保护机制:针对前沿大模型开发(如训练基础设施构建),Fable 5 设有不提示用户的性能限制层,防止加速竞争对手的模型训练。
- 成本成为主要门槛:API 定价为输入 $10/百万 token,输出 $50/百万 token。长任务和高强度使用将产生极高成本,普通用户需重新评估每次调用的性价比。
- 能力显著提升:在软件工程(如 5000 万行代码迁移)、视觉理解(游戏通关、图表提取)、长上下文记忆及生命科学领域均有突破性表现,基准测试遥遥领先。
- 普惠窗口期倒计时:随着模型变强且成本精细化,普通人与先进生产力之间的信息差可能因昂贵的 token 计费而重新拉开。
意义与影响
1. AI 使用范式的根本转变 Fable 5 的发布不仅是模型能力的升级,更是 AI 商业模式的转折点。AI 正从一种模糊真实成本的“包月服务”,转变为一种按量计价的“生产资料”。用户将从“拥有工具”转变为“购买算力”,每一次调用、每一个长任务都需要精打细算。这种转变将迫使普通用户重新审视 AI 的使用场景,仅在真正高价值任务中调用最强模型。
2. 技术普惠与数字鸿沟的再平衡 过去,订阅制让普通个体能以较低成本接触世界顶级的 AI 能力,缩小了与巨头之间的信息差。然而,Token 计费时代的到来,意味着获得前沿能力的门票正在提高。虽然 Anthropic 声称定价低于预览版,但对于高频或长任务用户而言,成本激增可能重新拉开普通人与先进生产力之间的距离。这种趋势在 OpenAI 等其他厂商中也可能重演,尤其是当这些公司寻求上市并需向资本市场证明持续盈利能力时。
3. 安全与创新的博弈 Anthropic 通过 Fable 5 和 Mythos 5 的分级,以及复杂的安全回退机制,展示了在开放前沿能力与控制风险之间的平衡
