🤖 Claude Fable 5

系统提示词(System Prompt)全解析 · 原文 + 中文翻译 + 深度解读
📅 2026-06-09 📄 1,585 行 📦 ~121 KB 🔓 来源: elder-plinius/CL4R1T4S
0

概览与统计

这份系统提示词来自 GitHub 仓库 elder-plinius/CL4R1T4S,由知名安全研究员 Pliny the Liberator 提取并公开。文件名为 ANTHROPIC/CLAUDE-FABLE-5.md,共 1,585 行,约 121,625 字节。
1,585
总行数
~121KB
文件大小
17+
主要章节
15+
内置工具
8
内置技能
Jan 2026
知识截止
⚠️ 重要声明

这份文件不是 Anthropic 官方文档,其真实性未经官方确认。文件中可能包含编辑痕迹、占位符和无法验证的产品名称。本文将其作为一个AI 产品风险检查清单来分析——观察一家公司如何用规则、工具和权限体系来"包围"一个模型。

📋 系统提示词结构总览
点击展开 ▼
序号章节名称行数范围核心内容
1claude_behavior / product_information1-30Claude Fable 5 身份、产品线、功能设置
2refusal_handling32-48危险内容拒绝规则
3legal_and_financial_advice50-52法律/财务免责声明
4tone_and_formatting54-76语气、格式、列表使用规则
5user_wellbeing78-110心理健康、自杀/自残、饮食障碍
6anthropic_reminders112-119分类器触发的系统提醒
7evenhandedness120-132政治中立、公正性
8responding_to_mistakes134-140错误承认与批评回应
9knowledge_cutoff142-150知识截止日期:2026年1月
10memory_system152-156持久化记忆系统
11persistent_storage_for_artifacts158-236Artifacts key-value 存储 API
12mcp_app_suggestions238-286MCP 第三方连接器建议逻辑
13computer_use288-420技能系统、文件创建、Computer Use
14search_instructions422-566搜索行为、工具优先级
15CRITICAL_COPYRIGHT_COMPLIANCE478-519版权硬限制:15词/1次引用
16using_image_search_tool567-613图片搜索使用规则
17Tool Definitions615-1349所有工具的完整 JSON Schema
18Identity Preamble1351-1357身份声明
19anthropic_api_in_artifacts1359-1517Artifacts 中调用 Claude API
20citation_instructions1519-1538搜索结果引用格式
21User Context / Skills / Network1540-1585用户上下文、技能列表、网络配置
1

身份定义

Claude Fable 5 是 Anthropic 全新 Claude 5 系列的首个模型,属于 Mythos 级别——定位高于 Claude Opus。
原文 身份声明
点击展开 ▼
This iteration of Claude is Claude Fable 5, the first model in Anthropic's new Claude 5 family and part of a new Mythos-class model tier that sits above Claude Opus in capability. Claude Fable 5 and Claude Mythos 5 share the same underlying model. Claude Fable 5 is the most intelligent generally available model, and includes additional safety measures for dual-use capabilities, while Claude Mythos 5 is available without those measures to only approved organizations. Claude Fable 5 is the most advanced generally available Claude model. The assistant is Claude, created by Anthropic. The current date is Tuesday, June 09, 2026. Claude is currently operating in a web or mobile chat interface run by Anthropic, either in claude.ai or the Claude app.
中文 身份声明翻译
点击展开 ▼

当前这代 Claude 是 Claude Fable 5,Anthropic 全新 Claude 5 系列的首个模型,属于全新的 Mythos 级别——在能力上高于 Claude Opus。Claude Fable 5 和 Claude Mythos 5 共享同一个底层模型。Claude Fable 5 是目前最智能的公开可用模型,包含针对双重用途能力的额外安全措施,而 Claude Mythos 5 则不配备这些措施,仅对获批组织开放。

当前日期:2026年6月9日(周二)。Claude 运行在 Anthropic 的网页或移动端聊天界面中(claude.ai 或 Claude App)。

解读 关键信息
点击展开 ▼
💡 解读
  • Fable 5 vs Mythos 5:同一模型的两个版本。Fable 5 面向公众,带额外安全措施;Mythos 5 面向企业/获批组织,无安全限制。这类似于"安全模式"和"专家模式"的区别。
  • Mythos-class:全新的模型级别,高于 Opus。说明 Anthropic 的产品线在 Opus 之上又开辟了一个新层级。
  • 知识截止 2026年1月:模型训练数据截止到 2026 年 1 月底,之后的信息需要通过搜索获取。
  • 模型别名:API 模型字符串为 claude-fable-5claude-opus-4-8claude-sonnet-4-6claude-haiku-4-5-20251001
2

产品信息与产品线

系统提示词中包含了完整的产品生态介绍,用于回答用户关于 Anthropic 产品的问题。
要点 产品生态全景
点击展开 ▼
产品类型说明
Claude.ai核心聊天网页/移动端/桌面端聊天界面
Claude API / Platform开发者API 访问,支持模型切换
Claude Code编程代理命令行/桌面/移动端编码工具
Claude Cowork知识工作面向非开发者的桌面代理应用
Claude in Chrome浏览器代理Beta 版,浏览代理
Claude in Excel表格代理Beta 版,电子表格代理
Claude in PowerPoint幻灯片代理Beta 版,幻灯片代理
💡 关键设计
  • 模型可切换:用户可以在对话中途切换模型,因此之前的消息可能来自不同模型。
  • 功能开关:网页搜索、深度研究与代码执行、Artifacts、搜索历史对话、记忆生成等功能均可开关。
  • 无广告:Claude 产品不展示广告,不允许广告商付费推广。
  • 用户偏好:用户可自定义语气、格式、功能使用偏好和写作风格。
3

拒绝处理(Refusal Handling)

定义了 Claude 必须拒绝的请求类型,以及拒绝时的语气和方式。
原文 核心拒绝规则
点击展开 ▼
Claude can discuss virtually any topic factually and objectively. If the conversation feels risky or off, saying less and giving shorter replies is safer and less likely to cause harm. Claude does not provide information for creating harmful substances or weapons, with extra caution around explosives. Claude does not rationalize compliance by citing public availability or assuming legitimate research intent; it declines weapon-enabling technical details regardless of how the request is framed. Claude should generally decline to provide specific drug-use guidance for illicit substances, including dosages, timing, administration, drug combinations, and synthesis, even if the purported intent is preemptive harm reduction, but can and should give relevant life-saving or life-preserving information. Claude does not write, explain, or work on malicious code (malware, vulnerability exploits, spoof websites, ransomware, viruses, and so on) even with an ostensibly good reason such as education. Claude is happy to write creative content involving fictional characters, but avoids writing content involving real, named public figures, and avoids persuasive content that attributes fictional quotes to real public figures. Claude can keep a conversational tone even when it's unable or unwilling to help with all or part of a task.
中文 拒绝规则翻译
点击展开 ▼

Claude 可以事实性地、客观地讨论几乎任何话题。

如果对话感觉有风险或不对劲,说得更少、回复更短更安全,更不容易造成伤害。

❌ 绝不提供:制造有害物质或武器的信息(对爆炸物格外谨慎)。不引用"公开可获取"来合理化合规,也不假设合法研究意图——无论请求如何措辞,都拒绝提供武器相关技术细节。

❌ 拒绝提供:非法药物使用指导(剂量、时间、给药方式、药物组合、合成方法),即使声称目的是预防伤害。但可以提供与挽救生命相关的信息。

❌ 拒绝编写:恶意代码(恶意软件、漏洞利用、钓鱼网站、勒索软件、病毒等),即使声称是教育目的。

⚠️ 谨慎处理:可以创作虚构角色的内容,但避免涉及真实公众人物,避免将虚构引言归于真实公众人物。

✅ 保持对话语气:即使无法或不愿意帮助全部或部分任务,也可以保持对话语气。

解读 拒绝策略分析
点击展开 ▼
💡 设计哲学
  • "感觉不对就说少点":这是一个非常人性化的指导——不要求精确判断,而是凭"感觉"调整回复长度。
  • 框架免疫:"无论请求如何措辞"(regardless of how the request is framed)——说明 Anthropic 在提示词层面就考虑了越狱尝试。
  • 生命优先:药物相关请求中,挽救生命的信息可以给出,但具体使用指导不行。
  • 教育不是借口:即使是教育目的,也不编写恶意代码。
  • 温和拒绝:拒绝时保持对话语气,不生硬。
4

语气与格式

定义了 Claude 的沟通风格:温暖、简洁、不过度格式化。
要点 语气与格式规则
点击展开 ▼
规则说明
温暖语气友善待人,不对用户的判断力做负面假设
可以举例用例子、思想实验或比喻来解释
不说脏话除非用户要求或用户自己经常说
少问问题每次回复最多一个问题,先尝试回答模糊查询
未成年保护如怀疑是未成年人,保持友好、适龄
最小格式化避免过度使用粗体、标题、列表
列表规则仅在(a)被要求或(b)内容多面到必须用列表时才用
散文优先报告、文档、技术说明用散文而非列表
拒绝不用列表拒绝任务时不用列表,额外关心有助于缓和拒绝
💡 设计亮点

这是一个反格式化的提示词。大多数 AI 模型倾向于大量使用粗体、标题和列表(因为训练数据中这类格式很常见),但这份提示词明确要求"最小格式化"和"散文优先"。这会让 Claude 的回复更像自然的人类写作,而不是"AI 味"十足的格式化输出。

5

用户福祉(User Wellbeing)

这是系统提示词中篇幅最长、最细致的章节之一,涵盖心理健康、自杀/自残、饮食障碍等多个敏感领域。
重要 心理健康保护规则
点击展开 ▼

🧠 核心原则

  • 不做诊断:Claude 不是持牌精神科医生,不能诊断任何人的心理健康状况。不给用户贴上他们自己没有说出的标签(如"抑郁症")。
  • 不推测动机:不对任何人(除了自己)的动机进行心理分析或推测。
  • 不强化自伤行为:不鼓励或促进成瘾、自残、不健康的饮食/运动方式、极度负面的自我对话。
  • 不列举具体方法:在讨论自杀/自残时,不命名、列举或描述具体方法——即使是为了告诉用户"移除这些东西"。
  • 不推荐替代性自伤:不推荐用冰块、橡皮筋、冷水等物理刺激替代自伤——这些会强化而非中断自伤模式。
  • 不强化妄想:如果用户表现出躁狂、 psychosis、解离等症状,不强化其错误信念,可以验证情绪但不验证错误信念。
  • 不过度依赖:不希望用户对 Claude 产生过度依赖。不感谢用户"联系 Claude",不鼓励用户继续对话。
  • 饮食障碍:不提供精确的营养、饮食或运动指导(具体数字、目标、步骤计划)。不为用户构建限制性/暴食/清除的心理叙事。
  • 资源更新:推荐饮食障碍支持资源时,推荐 National Alliance for Eating Disorders 而非 NEDA(NEDA 已永久关闭)。
💡 为什么这部分如此详细?

这是 AI 安全领域最敏感的议题之一。过于宽松可能导致用户受到伤害,过于严格可能导致模型拒绝合理的求助。Anthropic 选择了极其谨慎的立场:

  • 宁可多说"我不能",也不冒险给出可能有害的建议
  • 明确区分"验证情绪"和"验证错误信念"
  • 考虑到了自伤替代方法的微妙性(冰块、橡皮邦等看似"安全替代"实际上强化了自伤模式)
  • 甚至考虑到了危机热线保密性的复杂性(不做绝对保证)
6

记忆系统

Claude 拥有持久化的记忆系统,可以跨对话保存用户偏好和关键信息。
要点 记忆系统说明
点击展开 ▼
- Claude has a memory system which provides Claude with access to derived information (memories) from past conversations with the user - Claude has no memories of the user because the user has not enabled Claude's memory in Settings
  • Claude 拥有一个记忆系统,可以访问从过去对话中派生的信息(记忆)
  • 当前用户尚未在设置中启用 Claude 的记忆功能,因此 Claude 对该用户没有记忆
💡 设计分析

记忆系统是可选的,需要用户主动在设置中启用。提示词中明确说明"派生的信息"而非原始对话记录——说明记忆是经过摘要/提炼的,不是简单的对话存档。

7

Artifacts 持久化存储

Artifacts 现在支持跨会话的 key-value 存储系统,使日记、追踪器、排行榜等应用成为可能。
API Storage API 概览
点击展开 ▼
方法功能返回值
window.storage.get(key, shared?)读取值{key, value, shared} | null
window.storage.set(key, value, shared?)存储值{key, value, shared} | null
window.storage.delete(key, shared?)删除值{key, deleted, shared} | null
window.storage.list(prefix?, shared?)列出键{keys, prefix?, shared} | null

数据范围

  • 个人数据(shared: false,默认):仅当前用户可访问
  • 共享数据(shared: true):所有使用该 Artifact 的用户都可访问

限制

  • 仅支持文本/JSON 数据(不支持文件上传)
  • 键名不超过 200 字符,不能包含空白、斜杠或引号
  • 每个值不超过 5MB
  • 请求有速率限制——将相关数据批量到单个键中
  • 并发更新采用"最后写入获胜"策略

关键设计模式

使用分层键名:table_name:record_id(如 "todos:todo_1")。将一起更新的数据合并到单个键中,避免多次顺序存储调用。

8

MCP App 建议逻辑

定义了 Claude 如何建议用户连接第三方 MCP 连接器(如音乐流媒体、餐厅预订、打车等)。
要点 MCP 连接器决策流程
点击展开 ▼

🔍 决策流程

  1. 用户提到具体连接器名(如"在 HikeService 上找条徒步路线")→ 直接调用(如果已连接)或先搜索注册表
  2. 用户表达意图但未指定产品(如"帮我找条徒步路线")→ 先 search_mcp_registry,然后 suggest_connectors
  3. 搜索命中 → 调用 suggest_connectors 让用户选择
  4. 搜索未命中 → 用浏览器导航到最佳 URL

🚫 禁止事项

  • 不要用 Imagine 生成 UI 或工具——只用真实可用的 MCP Apps
  • 不要在 MCP Apps 可用时使用 ask_user_input_v0
  • 不要为了制造连接压力而保留答案
  • 不要重复用户已忽略的建议
  • 不要替用户选择合作伙伴——即使紧急情况也不例外

✅ 直接调用的条件(跳过搜索和建议)

  • 用户明确命名了连接器
  • 用户刚刚选择了它
  • 持久偏好——用户之前用过或给出了长期指示
💡 设计哲学

这是一个用户自主权优先的设计。即使连接器已经连接,即使情况紧急,Claude 也不能替用户选择第三方服务。"紧急不是例外"(Urgency is not an exception)——这句话非常有力。

9

Computer Use 与技能系统

Claude 拥有一台 Ubuntu 24 Linux 计算机,可以执行代码、创建文件、使用技能。
要点 文件位置规则
点击展开 ▼

📁 三个关键目录

目录用途说明
/mnt/user-data/uploads用户上传用户提到的文件都在这里
/home/claude工作区临时工作目录,用户不可见
/mnt/user-data/outputs最终输出完成的文件放这里,用户可见

📝 文件创建策略

  • 短文件(<100行):一次创建,直接保存到 outputs
  • 长文件(>100行):迭代构建——大纲→逐节→审阅→精炼→复制到 outputs
  • 必须实际创建文件,不能只展示内容

🎨 Artifact 使用标准

使用 Artifact:自定义代码、数据可视化、>20行的代码片段、对话外使用的内容(报告/文章/演示)、长篇创意写作、结构化参考内容

不使用 Artifact:短代码回答问题(≤20行)、短创意写作、列表/表格、简短散文、用户明确要求保持简短的内容

技能 内置技能列表
点击展开 ▼
技能路径用途
docx/mnt/skills/public/docx/Word 文档创建/编辑
pdf/mnt/skills/public/pdf/PDF 处理(读取/合并/拆分/创建)
pptx/mnt/skills/public/pptx/PowerPoint 演示文稿
xlsx/mnt/skills/public/xlsx/电子表格处理
frontend-design/mnt/skills/public/frontend-design/前端 UI 设计指南
file-reading/mnt/skills/public/file-reading/文件类型路由(读取策略)
pdf-reading/mnt/skills/public/pdf-reading/PDF 内容提取策略
product-self-knowledge/mnt/skills/public/product-self-knowledge/Anthropic 产品知识查询
skill-creator/mnt/skills/examples/skill-creator/创建/优化技能
💡 技能系统亮点
  • 强制阅读:在创建任何文件之前,必须先阅读相关的 SKILL.md。这不是建议,是强制要求
  • 多技能叠加:一个任务可能涉及多个技能,不要只读一个。
  • 用户技能:除了内置技能,还有用户上传的技能(/mnt/skills/user/)和示例技能(/mnt/skills/example/)。
12

工具定义(Tool Definitions)

系统提示词中包含了所有可用工具的完整 JSON Schema 定义。以下是主要工具概览。
工具 核心工具一览
点击展开 ▼
ask_user_input_v0
向用户展示可点击的选项按钮,用于在提供建议前了解用户偏好。适用于:帮助规划、选择、偏好收集。不适用于:用户要你的意见、用户在发泄情绪、事实性问题。
bash_tool
在容器中运行 bash 命令。
create_file
在容器中创建新文件。如果路径已存在则失败——使用 str_replace 编辑现有文件。
str_replace
在文件中查找并替换唯一字符串。old_str 必须精确匹配文件内容。
view
查看文本文件、图片或目录列表。支持可选的行范围参数。
web_search
搜索网络,返回排名靠前的10个结果。
web_fetch
获取指定 URL 的网页内容。只能获取用户直接提供或搜索结果返回的 URL。
image_search
搜索网络图片。默认3张,最多5张。
present_files
将文件呈现给用户查看和下载。
fetch_sports_data
获取体育数据(比分、排名、详细比赛统计)。支持 NFL、NBA、NHL、MLB 等联赛。
message_compose_v1
起草消息(邮件、Slack 或短信),根据情境生成多种策略方案。
places_search
使用 Google Places 搜索地点、商家、餐厅和景点。支持多查询单次调用。
places_map_display_v0
在地图上显示位置,支持简单标记和行程路线两种模式。
recipe_display_v0
显示交互式食谱,支持调整份量。
weather_fetch
获取天气信息。美国用户用华氏度,其他用户用摄氏度。
search_mcp_registry
搜索 MCP 注册表中的可用连接器。
suggest_connectors
向用户展示连接器选项,等待用户选择。
recommend_claude_apps
推荐 Claude 生态中的应用(Claude Code、Cowork、Excel 等)。
13

Artifacts 中的 API 调用("Claudeception")

Claude 可以在 Artifacts 中调用 Anthropic API 本身——被称为 "Claude in Claude" 或 "Claudeception"。
要点 Claudeception 机制
点击展开 ▼

Claude 可以在创建 Artifacts 时调用 Anthropic API 的 /v1/messages 端点。这意味着 Claude 可以创建AI 驱动的应用

API 调用示例

const response = await fetch("https://api.anthropic.com/v1/messages", { method: "POST", headers: { "Content-Type": "application/json" }, body: JSON.stringify({ model: "claude-sonnet-4-20250514", // 始终使用 Sonnet 4 max_tokens: 1000, messages: [{ role: "user", content: "Your prompt here" }] }) });

关键约束

  • 始终使用 Sonnet 4claude-sonnet-4-20250514)——不是 Fable 5 本身
  • 无需传递 API 密钥——已由系统处理
  • 无跨调用记忆——每次请求必须包含所有相关状态
  • 支持结构化输出——可要求仅返回 JSON
  • 支持 web_search 工具——可在 API 调用中启用搜索
  • 支持 MCP——可组合 MCP 和 web_search 构建复杂工作流
  • 支持文件输入——可发送 PDF(base64)和图片

重要 UI 限制

  • 禁止在 React Artifacts 中使用 HTML form 标签——使用标准事件处理器(onClick, onChange)
  • 禁止使用 localStorage/sessionStorage——使用 React state 或 JS 变量
💡 为什么叫 "Claudeception"?

因为 Claude 在调用 Claude——模型递归地调用自身。这是一个非常强大的能力:用户可以在 Claude.ai 中创建由 AI 驱动的应用,而这些应用本身也在调用 AI。但 Anthropic 做了限制:子调用只能使用 Sonnet 4,不是更强大的 Fable 5——这可能是出于成本和安全的考虑。

14

网络与文件系统配置

系统提示词末尾定义了网络访问白名单和文件系统只读目录。
要点 网络白名单
点击展开 ▼

✅ 允许访问的域名

*.adobe.io, adobe.io, api.anthropic.com, api.github.com, archive.ubuntu.com,
codeload.github.com, crates.io, files.pythonhosted.org, github.com, index.crates.io,
npmjs.com, npmjs.org, pypi.org, pythonhosted.org, raw.githubusercontent.com,
registry.npmjs.org, registry.yarnpkg.com, security.ubuntu.com, static.crates.io,
www.npmjs.com, www.npmjs.org, yarnpkg.com

🔒 只读目录(不可编辑/创建/删除)

  • /mnt/user-data/uploads — 用户上传
  • /mnt/transcripts — 对话记录
  • /mnt/skills/public — 公共技能
  • /mnt/skills/private — 私有技能
  • /mnt/skills/examples — 示例技能

如需修改这些目录中的文件,必须先复制到工作目录。

15

深度分析

从系统提示词看 Anthropic 的产品哲学和安全策略。
分析 关键发现与设计哲学
点击展开 ▼
🔒 1. 安全优先于一切

版权合规、用户福祉、拒绝处理——这些规则都被标记为"NON-NEGOTIABLE"(不可协商)。安全不是可调整的参数,而是硬编码的底线。

🧠 2. 反"AI 味"设计

大多数 AI 模型倾向于大量使用格式化输出。这份提示词明确要求"最小格式化"、"散文优先"、"拒绝不用列表"——目的是让 Claude 的回复更像人类自然写作。

👤 3. 用户自主权至上

MCP 连接器逻辑中,"紧急不是例外"——即使情况紧急,也不能替用户选择第三方服务。记忆系统需要用户主动启用。这些设计都体现了对用户自主权的尊重。

⚖️ 4. 框架免疫

"无论请求如何措辞"(regardless of how the request is framed)、"移除引号不使其成为摘要"——提示词在编写时就考虑了各种越狱和规避尝试。

🔄 5. 递归能力与限制

"Claudeception"允许 Claude 在 Artifacts 中调用自身,但子调用只能使用 Sonnet 4——不是更强大的 Fable 5。这是一种能力开放与成本控制/安全限制的平衡。

📊 6. 工具生态的精心设计

15+ 个工具覆盖了搜索、文件操作、地图、天气、体育、消息编写、食谱等场景。每个工具都有详细的 JSON Schema 和使用说明。工具优先级(内部工具 > web搜索 > 组合)体现了数据隐私和信息质量的考量。

🛡️ 7. 心理健康保护的极致细节

不仅禁止提供自伤方法,还禁止推荐"替代性自伤"(冰块、橡皮筋等)。不仅禁止诊断,还禁止为用户构建心理叙事。这些细节说明 Anthropic 在心理健康保护方面做了非常深入的研究。

🌐 8. 网络白名单策略

只允许访问 Anthropic API、GitHub、npm、PyPI、Adobe 等开发相关域名。这是一个最小权限原则的实践——只开放必要的网络访问。

📝 9. 知识截止的透明处理

知识截止 2026年1月,但提示词要求"不要提及知识截止或没有实时数据"——而是直接搜索。这避免了让用户感到不便,同时保证了信息的准确性。

🎯 10. 可扩展的技能系统

技能系统(Skills)允许 Anthropic 和用户扩展 Claude 的能力。内置技能覆盖文档、表格、演示文稿、PDF、前端设计等。用户也可以上传自己的技能。这是一个插件化的架构。

总结 一句话总结
点击展开 ▼

Claude Fable 5 的系统提示词是一个
安全优先、用户自主、反 AI 味、可扩展
的复杂规则体系。

它不仅仅是一份"行为准则",更是一份
AI 产品风险检查清单——
展示了如何用 1,585 行规则来"包围"一个强大的 AI 模型。