AI 资讯量子位·2 小时前

Claude Mythos 5发布：1天完成5000万行代码

原标题：刚刚，Claude Mythos 5发布！5000万行代码1天搞定

速览

Anthropic正式发布了新一代模型Claude Mythos 5。该模型在代码处理能力上实现重大突破，据称能在一天内完成5000万行代码的处理任务。这一进展标志着AI在复杂软件工程领域的性能进一步提升。

AI 深度解读

背景

Anthropic 在经历了长达两个月的“神话”（Mythos）系列预热后，正式发布了其有史以来最强大的大模型旗舰系列。此次发布不仅标志着 Anthropic 在技术能力上的重大突破，更揭示了前沿 AI 产品在安全机制、商业模式及人机协作范式上的深刻转变。

就在 Anthropic 此前郑重呼吁暂停 AI 研究不久后，其创始人 Dario Amodei 却以极大的阵仗推出了这一新一代模型，这种反差引发了业界的广泛讨论。此次发布的核心产品包括面向公众的 Claude Fable 5 和面向少数受信任用户的满血版 Claude Mythos 5。这一举动被视为 AI 行业进入“权限时代”和“工作室模式”的标志性事件。

核心内容

1. 双版本发布策略：能力与安全的分离 Anthropic 此次推出了两个版本，旨在平衡极致能力与安全风险：

Claude Fable 5：面向所有用户开放的旗舰版本。它并非完全解除限制的版本，而是内置了一套独立的“防护网”机制。当用户提问触发风险分类器（如试图生成恶意软件、涉及生化风险或模型蒸馏）时，系统会自动降级调用上一代模型 Claude Opus 4.8 进行回答，并告知用户发生了降级。这种设计将“能力”与“安全”解耦，日常任务由 Fable 5 处理，高风险任务由 Opus 4.8 兜底。
Claude Mythos 5：原汁原味的“满血版” Mythos，仅向少数受信任用户开放。它在网络安全、生物科研等领域解除了安全限制，官方称其拥有“全球最顶尖的网安攻防与生物科研纯血能力”。

2. 技术性能突破：从单轮问答到长周期自主代理 Fable 5 和 Mythos 5 共享同一底层内核，其核心优势在于处理长周期、高复杂度任务的能力，而非仅仅提升单轮对话质量：

软件工程：在 SWE-bench Pro 评测中，Fable 5 得分高达 80.3%，远超竞争对手 GPT-5.5 的 58.6%。典型案例中，Fable 5 在一天内完成了一个 5000 万行 Ruby 代码库的全库迁移，而人工团队需耗时两个多月。在 ViBench 基准测试中，它实现了“一枪流”生成应用。
原生视觉与游戏：Fable 5 无需外部工具或“脚手架”，仅凭原始屏幕截图即可自主推演并通关《宝可梦·火红版》。在接入持久化文件记忆后，其在《杀戮尖塔》中的表现提升了 3 倍。
长上下文与记忆：模型能在百万级 Token 的长期任务中保持专注，并利用笔记改进输出。这种稳定的记忆能力是 Agent 自主运行的基础。
前沿科研：在生物医药领域，Mythos 5 能独立执行生物学家的完整工作流，包括选择蛋白质结合位点、调度工具及自主 Debug。其设计的 14 个蛋白质靶向复合物中，有 9 个已进入真实药物研发管线。在基因组学中，Mythos 5 自主拼凑 138 个物种数据并训练出的微型模型，击败了发表在《Science》上的最新成果。

3. 安全机制与数据治理的新常态 Anthropic 将安全从简单的“拒绝回答”升级为复杂的产品架构：

模型路由机制：超过 95% 的正常会话由 Fable 5 处理，不到 5% 的高风险请求被路由至 Opus 4.8。这种设计旨在提供比直接拒绝更好的用户体验，同时防范网络安全、生化风险及模型蒸馏。
数据留存政策：从 Fable 5 开始，Anthropic 要求所有 Mythos 级模型的流量保留 30 天，涵盖第一方和第三方使用场景。这些数据仅用于安全监控（如识别复杂攻击和新型越狱），不用于训练，但对企业客户构成了现实的数据治理挑战。

4. 定价与可用性

API 定价：大幅降低预览版价格，每百万输入 Token 10 美元，每百万输出 Token 50 美元。
免费窗口期：6 月 22 日前，Pro、Max、Team 和企业版用户可免费使用 Fable 5；6 月 23 日起需购买 usage credits。Anthropic 表示未来产能跟上后，Fable 5 将重新成为订阅标配。

5. 人机协作范式的逆转：从“巫师”到“甲方” 沃顿商学院教授 Ethan Mollick 的内测体验揭示了人机关系的根本变化：

过去：人类像“巫师”，需要手把手指导 AI，精雕细琢 Prompt。
现在：人类沦为“赞助人”或“甲方”。用户只需提供宏观需求（如一份 15 页的项目文档），AI 即可在后台自主生成 Agent 工作流，调度多个子代理完成调研、撰写、校对等任务，历时 9 小时后交付高质量成品。
隐喻：使用 Fable 5 如同雇佣了一家好莱坞级别的设计院或顶尖科研所，人类只需扮演验收者，无需关心黑盒内的微观决策。

关键要点

模型架构：Claude Fable 5 是面向公众的安全版，Claude Mythos 5 是面向内部/受信任用户的无限制版，二者底层技术一致。
安全创新：采用“模型路由”而非简单拒绝，高风险请求自动降级至 Claude Opus 4.8，平衡了体验与安全。
代码能力：Fable 5 在 SWE-bench Pro 中得分 80.3%，能一天完成 5000 万行代码库迁移，远超人工效率。
科研突破：Mythos 5 在生物医药领域能独立执行完整工作流，其生成的分子假设被科学家采纳并推进至实验阶段。
成本效率：API 价格降至输入 10 美元/百万 Token，输出 50 美元/百万 Token，强调 Token 效率以解决 Agent 落地成本问题。
数据隐私：Mythos 级模型流量保留 30 天用于安全监控，企业客户需接受更严格的数据治理要求。
协作模式：AI 从被动工具转变为自主 Agent，人类角色从“操作者”转变为“验收者/甲方”，需具备宏观把控和验收能力。

意义与影响

1. AI 产品形态进入“权限时代” Anthropic 的发布表明，前沿 AI 不再仅仅是能力的堆砌，而是进入了精细化的权限管理和安全分级阶段。通过 Fable 5 的“防护网”机制，Anthropic 展示了一种新的产品范式：安全不再是事后补救的免责声明，而是嵌入在分类器、路由和架构中的核心组件。这对其他 AI 厂商提出了更高的安全工程要求。

2. 软件工程与科研范式的重构 Fable 5 在代码迁移和科研假设生成上的表现，证明了 AI 已具备处理长周期、高复杂度任务的能力。在软件工程领域，AI 从“辅助编程”走向“自主重构”；在科研领域，AI 从“数据工具”走向“独立研究者”。这将极大加速研发流程，但也对从业者的技能结构提出了新要求——从执行者转向监督者和验收者。

3. 人机协作关系的根本性逆转 Ethan Mollick 提出的“甲方”隐喻深刻揭示了未来工作流的本质变化。随着 AI 自主性（Autonomy）的提升，人类的价值将从“如何命令 AI”转向“如何定义问题”和“如何评估结果”。这种转变要求用户具备更高的宏观视野和验收能力，同时也带来了“黑盒依赖”的风险——用户可能因过度信任 AI 的自主决策而忽视潜在错误。

4. 商业落地与数据治理的挑战 尽管 API 价格大幅下降，但 30 天的数据留存政策对企业客户构成了新的合规挑战。在享受强大 Agent 能力的同时，企业必须

查看原文 →qbitai.com

Claude Mythos 5发布：1天完成5000万行代码

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐