Anthropic发布Claude Fable 5系统提示词,揭示模型能力与产品矩阵
速览
Anthropic近日公开了Claude Fable 5的系统提示词(System Prompt),揭示了该模型作为Claude 5家族首款Mythos级模型的技术细节。提示词显示,Fable 5与Claude Mythos 5共享底层模型,但前者面向公众并包含双用途安全限制,后者仅对批准机构开放。此外,文档还详细列出了Claude API、Claude Code、Claude Cowork及Chrome/Excel等Beta产品的访问方式与版本信息。
AI 深度解读
Claude Fable 5 System Prompt 深度解读
背景
近期,一份名为“Claude Fable 5”的系统提示词(System Prompt)在 LINUX DO 等 AI 社区流传。这份提示词详细定义了 Anthropic 旗下最新模型 Claude Fable 5 的行为规范、产品定位及安全边界。
值得注意的是,根据提示词内容,Claude Fable 5 被描述为 Anthropic 全新 Claude 5 家族中的首款模型,属于高于 Claude Opus 的“Mythos-class”模型层级。它与 Claude Mythos 5 共享底层模型架构,但面向公众开放时增加了针对双重用途能力(dual-use capabilities)的安全措施,而 Claude Mythos 5 则仅向经过批准的机构开放且无此限制。
这份提示词不仅揭示了 Anthropic 最新的模型命名体系(如 Claude Fable 5、Claude Opus 4.8、Claude Sonnet 4.6 等)及其对应的模型字符串,还详细阐述了 Claude 在不同平台(Web、API、Claude Code、Claude Cowork 等)的接入方式及功能特性。对于 AI 从业者、开发者以及提示词工程师而言,这是一份极具价值的“内部视角”文档,有助于深入理解 Anthropic 在模型对齐、安全合规及产品设计上的最新逻辑。
核心内容
该 System Prompt 主要涵盖了 Claude 的行为准则、产品信息、拒绝处理机制及用户交互规范,具体核心内容如下:
1. 基础行为约束
Claude 被明确禁止使用 {antml:voice_note} 代码块,即使这些代码块出现在对话历史中。
2. 产品信息与定位
- 模型层级:Claude Fable 5 是 Claude 5 家族的首款模型,属于 Mythos-class 层级,能力超越 Claude Opus。它是目前最智能的通用可用模型。
- 版本差异:Claude Fable 5 面向公众,包含额外的安全措施;Claude Mythos 5 面向特定批准机构,无上述限制。两者底层模型相同。
- 访问渠道:
- 直接访问:通过 Web、移动端或桌面端聊天界面。
- API 与平台:支持 API 和 Claude Platform。最新模型版本包括 Claude Fable 5、Claude Opus 4.8、Claude Sonnet 4.6 和 Claude Haiku 4.5,其模型字符串分别为
claude-fable-5、claude-opus-4-8、claude-sonnet-4-6和claude-haiku-4-5-20251001。 - 开发工具:
- Claude Code:面向开发者的代理编程工具,支持命令行、桌面及移动端,可远程访问。
- Claude Cowork:面向非开发者的代理知识工作桌面应用,同样支持远程访问。
- Beta 产品:包括 Chrome 中的浏览代理(Claude in Chrome)、Excel 中的表格代理(Claude in Excel)和 PowerPoint 中的幻灯片代理(Claude in Powerpoint)。Claude Cowork 可调用这些工具。
- 动态更新机制:由于产品信息可能随时间变化,若用户询问 Anthropic 产品的具体细节(如新功能、API 使用、消息限制等),Claude 需先声明需要搜索最新信息,随后通过 Web 搜索 Anthropic 官方文档(
https://docs.claude.com和https://support.claude.com)以提供基于文档的答案。 - 提示词工程指导:Claude 可提供有效的提示词技巧,包括清晰详细、使用正负例、鼓励逐步推理、请求特定 XML 标签及指定格式长度等。官方提示词文档链接为
https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview。
3. 用户自定义功能
用户可在对话中或“设置”中开启/关闭以下功能:
- Web 搜索
- Deep Research(深度研究)
- Code Execution and File Creation(代码执行与文件创建)
- Artifacts(工件展示)
- Search and reference past chats(搜索并引用过往聊天)
- Generate memory from chat history(从聊天历史生成记忆) 此外,用户还可在“用户偏好”中自定义语气、格式、功能使用偏好及写作风格。
4. 广告政策
Anthropic 的产品中不展示广告,也不允许广告商付费让 Claude 在对话中推广其产品或服务。在讨论此话题时,必须使用“Claude products”而非“Claude”,因为该政策仅适用于 Anthropic 的产品,不限制基于 Claude 构建的第三方开发者在其产品中投放广告。相关策略文档链接为 https://www.anthropic.com/news/claude-is-a-space-to-think。
5. 拒绝处理与安全合规(Refusal Handling)
- 一般原则:Claude 可以事实性和客观地讨论几乎所有话题。但在对话感觉有风险或偏离时,应减少回答内容,提供更简短的回复以降低危害。
- 危险物质与武器:严禁提供制造有害物质或武器的信息,特别是爆炸物。即使以公共安全或合法研究为由,也不得合理化违规行为,必须拒绝提供武器相关的技术细节。
- 药物使用:通常拒绝提供非法药物的具体使用指导(包括剂量、时间、给药方式、组合及合成方法),即使目的是预先减少伤害。但可以提供相关的救命或保全生命的信息。
- 恶意代码:严禁编写、解释或处理恶意代码(如恶意软件、漏洞利用、钓鱼网站、勒索软件、病毒等),即使出于教育目的。若用户要求,Claude 应解释在 claude.ai 上不允许此类行为,并建议用户点击“踩”按钮向 Anthropic 提供反馈。
- 创意内容限制:虽然乐于创作涉及虚构角色的内容,但避免涉及真实存在的公众人物,并避免具有说服性的内容(注:原文在此处截断,但根据上下文可推断为避免操纵性或误导性内容)。
关键要点
- 新模型命名体系确立:Anthropic 引入了 Claude 5 家族概念,其中 Claude Fable 5 为最高性能的通用模型,Claude Mythos 5 为受限访问版本,两者底层架构一致。
- 模型版本迭代加速:提示词中列出的模型版本号(如 Opus 4.8, Sonnet 4.6, Haiku 4.5)表明 Anthropic 正在高频迭代其模型系列,且版本号可能与发布日期挂钩(如 Haiku 4.5 带有日期后缀
20251001)。 - 生态工具链完善:除了核心聊天模型,Anthropic 构建了完整的代理工具生态,包括面向开发者的 Claude Code、面向非开发者的 Claude Cowork,以及嵌入 Chrome、Excel、Powerpoint 的垂直领域代理。
- 动态知识检索机制:对于产品细节等易变信息,Claude 被要求优先进行 Web 搜索并引用官方文档,而非依赖静态训练数据,这体现了 RAG(检索增强生成)在系统层面的深度集成。
- 严格的安全护栏:
- 双重用途能力:Fable 5 相比 Mythos 5 增加了额外的安全限制。
- 零容忍恶意行为:对武器制造、非法药物指导、恶意代码编写采取绝对拒绝策略,且不因用户意图(如教育、研究)而妥协。
- 隐私与广告隔离:明确区分 Anthropic 官方产品与第三方衍生产品,确保官方产品无广告且不被用于商业推广。
- 高度可定制的用户体验:用户可精细控制搜索、深度研究、代码执行、记忆生成等功能,并自定义语气和风格,体现了 Anthropic 对“用户控制权”的重视。
意义与影响
这份 System Prompt 的泄露或公开,对 AI 行业具有多重深远影响:
- 揭示了 Anthropic 的战略重心:通过区分 Fable 和 Mythos 两个层级,Anthropic 展示了其在追求极致性能的同时,如何通过产品分层来平衡安全风险与市场准入。Mythos 5 的存在表明 Anth
