← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

Anthropic发布Claude Fable 5系统提示词,揭示模型能力与产品矩阵

原标题:Fable 5的 System Prompt,超长!

速览

Anthropic近日公开了Claude Fable 5的系统提示词(System Prompt),揭示了该模型作为Claude 5家族首款Mythos级模型的技术细节。提示词显示,Fable 5与Claude Mythos 5共享底层模型,但前者面向公众并包含双用途安全限制,后者仅对批准机构开放。此外,文档还详细列出了Claude API、Claude Code、Claude Cowork及Chrome/Excel等Beta产品的访问方式与版本信息。

AI 深度解读

Claude Fable 5 System Prompt 深度解读

背景

近期,一份名为“Claude Fable 5”的系统提示词(System Prompt)在 LINUX DO 等 AI 社区流传。这份提示词详细定义了 Anthropic 旗下最新模型 Claude Fable 5 的行为规范、产品定位及安全边界。

值得注意的是,根据提示词内容,Claude Fable 5 被描述为 Anthropic 全新 Claude 5 家族中的首款模型,属于高于 Claude Opus 的“Mythos-class”模型层级。它与 Claude Mythos 5 共享底层模型架构,但面向公众开放时增加了针对双重用途能力(dual-use capabilities)的安全措施,而 Claude Mythos 5 则仅向经过批准的机构开放且无此限制。

这份提示词不仅揭示了 Anthropic 最新的模型命名体系(如 Claude Fable 5、Claude Opus 4.8、Claude Sonnet 4.6 等)及其对应的模型字符串,还详细阐述了 Claude 在不同平台(Web、API、Claude Code、Claude Cowork 等)的接入方式及功能特性。对于 AI 从业者、开发者以及提示词工程师而言,这是一份极具价值的“内部视角”文档,有助于深入理解 Anthropic 在模型对齐、安全合规及产品设计上的最新逻辑。

核心内容

该 System Prompt 主要涵盖了 Claude 的行为准则、产品信息、拒绝处理机制及用户交互规范,具体核心内容如下:

1. 基础行为约束

Claude 被明确禁止使用 {antml:voice_note} 代码块,即使这些代码块出现在对话历史中。

2. 产品信息与定位

  • 模型层级:Claude Fable 5 是 Claude 5 家族的首款模型,属于 Mythos-class 层级,能力超越 Claude Opus。它是目前最智能的通用可用模型。
  • 版本差异:Claude Fable 5 面向公众,包含额外的安全措施;Claude Mythos 5 面向特定批准机构,无上述限制。两者底层模型相同。
  • 访问渠道
    • 直接访问:通过 Web、移动端或桌面端聊天界面。
    • API 与平台:支持 API 和 Claude Platform。最新模型版本包括 Claude Fable 5、Claude Opus 4.8、Claude Sonnet 4.6 和 Claude Haiku 4.5,其模型字符串分别为 claude-fable-5claude-opus-4-8claude-sonnet-4-6claude-haiku-4-5-20251001
    • 开发工具
      • Claude Code:面向开发者的代理编程工具,支持命令行、桌面及移动端,可远程访问。
      • Claude Cowork:面向非开发者的代理知识工作桌面应用,同样支持远程访问。
    • Beta 产品:包括 Chrome 中的浏览代理(Claude in Chrome)、Excel 中的表格代理(Claude in Excel)和 PowerPoint 中的幻灯片代理(Claude in Powerpoint)。Claude Cowork 可调用这些工具。
  • 动态更新机制:由于产品信息可能随时间变化,若用户询问 Anthropic 产品的具体细节(如新功能、API 使用、消息限制等),Claude 需先声明需要搜索最新信息,随后通过 Web 搜索 Anthropic 官方文档(https://docs.claude.comhttps://support.claude.com)以提供基于文档的答案。
  • 提示词工程指导:Claude 可提供有效的提示词技巧,包括清晰详细、使用正负例、鼓励逐步推理、请求特定 XML 标签及指定格式长度等。官方提示词文档链接为 https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview

3. 用户自定义功能

用户可在对话中或“设置”中开启/关闭以下功能:

  • Web 搜索
  • Deep Research(深度研究)
  • Code Execution and File Creation(代码执行与文件创建)
  • Artifacts(工件展示)
  • Search and reference past chats(搜索并引用过往聊天)
  • Generate memory from chat history(从聊天历史生成记忆) 此外,用户还可在“用户偏好”中自定义语气、格式、功能使用偏好及写作风格。

4. 广告政策

Anthropic 的产品中不展示广告,也不允许广告商付费让 Claude 在对话中推广其产品或服务。在讨论此话题时,必须使用“Claude products”而非“Claude”,因为该政策仅适用于 Anthropic 的产品,不限制基于 Claude 构建的第三方开发者在其产品中投放广告。相关策略文档链接为 https://www.anthropic.com/news/claude-is-a-space-to-think

5. 拒绝处理与安全合规(Refusal Handling)

  • 一般原则:Claude 可以事实性和客观地讨论几乎所有话题。但在对话感觉有风险或偏离时,应减少回答内容,提供更简短的回复以降低危害。
  • 危险物质与武器:严禁提供制造有害物质或武器的信息,特别是爆炸物。即使以公共安全或合法研究为由,也不得合理化违规行为,必须拒绝提供武器相关的技术细节。
  • 药物使用:通常拒绝提供非法药物的具体使用指导(包括剂量、时间、给药方式、组合及合成方法),即使目的是预先减少伤害。但可以提供相关的救命或保全生命的信息。
  • 恶意代码:严禁编写、解释或处理恶意代码(如恶意软件、漏洞利用、钓鱼网站、勒索软件、病毒等),即使出于教育目的。若用户要求,Claude 应解释在 claude.ai 上不允许此类行为,并建议用户点击“踩”按钮向 Anthropic 提供反馈。
  • 创意内容限制:虽然乐于创作涉及虚构角色的内容,但避免涉及真实存在的公众人物,并避免具有说服性的内容(注:原文在此处截断,但根据上下文可推断为避免操纵性或误导性内容)。

关键要点

  • 新模型命名体系确立:Anthropic 引入了 Claude 5 家族概念,其中 Claude Fable 5 为最高性能的通用模型,Claude Mythos 5 为受限访问版本,两者底层架构一致。
  • 模型版本迭代加速:提示词中列出的模型版本号(如 Opus 4.8, Sonnet 4.6, Haiku 4.5)表明 Anthropic 正在高频迭代其模型系列,且版本号可能与发布日期挂钩(如 Haiku 4.5 带有日期后缀 20251001)。
  • 生态工具链完善:除了核心聊天模型,Anthropic 构建了完整的代理工具生态,包括面向开发者的 Claude Code、面向非开发者的 Claude Cowork,以及嵌入 Chrome、Excel、Powerpoint 的垂直领域代理。
  • 动态知识检索机制:对于产品细节等易变信息,Claude 被要求优先进行 Web 搜索并引用官方文档,而非依赖静态训练数据,这体现了 RAG(检索增强生成)在系统层面的深度集成。
  • 严格的安全护栏
    • 双重用途能力:Fable 5 相比 Mythos 5 增加了额外的安全限制。
    • 零容忍恶意行为:对武器制造、非法药物指导、恶意代码编写采取绝对拒绝策略,且不因用户意图(如教育、研究)而妥协。
    • 隐私与广告隔离:明确区分 Anthropic 官方产品与第三方衍生产品,确保官方产品无广告且不被用于商业推广。
  • 高度可定制的用户体验:用户可精细控制搜索、深度研究、代码执行、记忆生成等功能,并自定义语气和风格,体现了 Anthropic 对“用户控制权”的重视。

意义与影响

这份 System Prompt 的泄露或公开,对 AI 行业具有多重深远影响:

  1. 揭示了 Anthropic 的战略重心:通过区分 Fable 和 Mythos 两个层级,Anthropic 展示了其在追求极致性能的同时,如何通过产品分层来平衡安全风险与市场准入。Mythos 5 的存在表明 Anth
查看原文 →linux.do