Agent SkillLINUX DO · AI·2026/2/6

LLM能力溢出，分享可维护的提示词五层构建法

原标题：LLM在某些方面的能力已经溢出，我们需要清晰而可维护、可迭代的提示词指导他们工作（个人提示词规范与制作思路分享）

速览

文章指出LLM在重复性及低风险创造性工作中能力已溢出，需通过结构化提示词发挥其语义理解优势并规避幻觉等不足。作者提出将提示词划分为知识、目标、行为、协议、规范五个互不相交的层级，以实现模块化修改。该方法强调先确定核心目标与工作流程，再补充背景知识与风格规范，从而构建清晰、可迭代且易于维护的AI工作指引。

AI 深度解读

LLM 能力溢出时代的提示词工程：构建清晰、可维护与可迭代的 AI 工作流

背景

随着大型语言模型（LLM）在语义理解、上下文记忆、模仿能力及知识储备上的飞速进步，其在许多重复性高、逻辑固定或信息处理量大的琐碎工作中，甚至部分低风险且需要一定创造力的领域（如教育教学、文案写作），能力已达到“溢出”状态。在特定细分领域（如解数学题、中等难度翻译），其表现甚至超越人类满分标准。

然而，能力的提升也带来了新的挑战。LLM 依然存在结果泛化（给出模糊答案）、幻觉（编造事实）、输出限制及工具调用限制等不足。传统的“黑盒式”提示词往往缺乏结构，导致难以维护、容易冲突且无法有效约束模型的边界。为了充分利用 LLM 的特长并规避其短板，提示词工程需要从简单的指令输入，转向构建清晰、模块化、可迭代且具备严格边界的系统化工作流。

核心内容

本文分享了一套个人化的提示词规范与制作思路，核心理念是将提示词视为一个可维护的软件项目，通过解耦和分层设计，实现对 LLM 行为的精确控制。

1. 提示词的五层架构

作者提出，一个成功的助手提示词应由五个互不相交的层次构成，每个层次负责不同的功能维度：

知识层（Knowledge Layer）：决定模型的工作领域。旨在补充模型可能缺失或过时的背景知识，通过提供精确的索引表或最新 API 用法，消除因“无知”或“旧知”导致的幻觉。
目标层（Goal Layer）：决定工作目标。必须明确输入内容的预期和产出内容的要求，详细且无歧义。这是提示词中最核心的部分，需首先思考并编写。
行为层（Behavior Layer）：决定工作流程。包含思维链（CoT）和具体的工作步骤，以及必要的特定原则（如算法选择）。通过拆解任务颗粒度，提高模型输出的可控性。
协议层（Protocol Layer）：决定工作风格。这是可替换性最强的层级，涉及语言风格、装饰性要求等。它不影响核心功能的完成，仅作为美化或特定场景的适配（如“可爱风格”或“极简风格”）。
规范层（Norm Layer）：决定工作禁区。用于防止模型自由发挥过度或纠正其常见错误，集中规定“不要做什么”。

2. 结构化与解耦原则

为确保提示词的可维护性和可迭代性，必须遵循严格的格式规范：

互不相交原则：五个层级之间、层级下的分类集（三级标题）以及点集（无序/有序列表）必须绝对互不相交。内容不能重复，确保修改某一部分时不影响其他部分。
层级限制：
- 层级使用二级标题（##）。
- 分类集使用三级标题（###）。
- 点集使用无序或有序符号。
- 禁止使用四级标题，除非逻辑上必须有序，否则不再继续细分，点集即为最小构成单元。
精细替换模式：在编写或二改提示词时，遵循“一层级、一类集或一点集一改”的原则。每次修改需明确说明哪个集要删、哪个集要加，避免全量重写导致的上下文混乱。

3. 编写与使用策略

编写顺序：先编写最重要的目标层，最后编写协议层，以保证协议层的可替换性。在未调试前，避免对行为层的原则和规范层的内容进行大量预想，应实事求是，先调查再修改。
长提示词处理：对于过长的提示词，可分批次发送（先发送前几层，再发送后几层）。对于大窗口非思考模型，可将提示词发送两遍以增强记忆。
任务类型适配：
- 渐进式任务：需讨论交流。在提示词末尾补充：“等待用户和你讨论，在此之前你只需要回顾你的工作流程”。
- 即时式任务：无需过多讨论。末尾补充：“等待用户给你预期输入，现在保持冷静与回顾自己的工作流程”，或直接附加用户问题。

4. 实践案例：GGB 代码大师

作者分享了重构后的“GGB 脚本生成助手”作为实践样例。针对 GeoGebra (GGB) 命令在训练数据中占比少、易出现旧知幻觉的问题，作者爬取手册并压缩制作了“GGBPuppy Codebook”（参数缩写对照表），将其放入知识层。

该提示词严格规定：

目标层：仅输出一个 GGB 脚本代码块，每行代码后附注释，禁止任何额外文字。
知识层：提供完整的参数简写对照表，作为解析数据的唯一依据。
规范层：禁止输出代码块外的解释。

通过这种结构，有效提升了模型生成 GGB 代码的准确率，实现了从“黑盒”到“蓝图驱动”的转变。

关键要点

能力边界认知：LLM 在特定领域能力已溢出，但需通过精确提示词弥补其幻觉和泛化问题，通过 Agent/MCP 等范式解决工具限制。
五层架构法：提示词应分为知识、目标、行为、协议、规范五个互不相交的层级，分别对应“拥有什么”、“做什么”、“怎么做”、“什么风格”、“不做什么”。
严格的结构规范：
- 使用 ## 表示层级，### 表示分类集，列表表示点集。
- 严禁使用四级标题，禁止内容重叠，确保模块解耦。
迭代式维护：采用“精细替换模式”，每次仅修改最小单元（点集/类集/层级），并明确记录变更，避免全量重写。
知识层对抗幻觉：对于模型不熟悉的领域（如特定库的 API），通过提供压缩后的索引表或最新用法指南，强制模型遵循“非黑即白”原则，消除旧知干扰。
协议层解耦：将风格性要求（如语言风格、装饰）独立为协议层，确保其替换不影响核心工作流，提高提示词的复用性。

意义与影响

这一提示词规范标志着 AI 应用从“简单问答”向“工程化工作流”的演进。

提升稳定性与可预测性：通过严格的层级划分和互不相交原则，消除了传统提示词中常见的逻辑冲突和模糊地带，使模型输出更加稳定、可控。
降低维护成本：引入软件工程的解耦思想，使得复杂提示词像代码模块一样易于调试、更新和复用。用户无需重新编写整个提示词，只需微调特定模块即可适应新需求。
优化人机协作效率：明确的输入输出预期和思维链引导，减少了模型“自由发挥”带来的无效交互，使 AI 更像一个遵循精确指令的专业助手，而非不可预测的黑盒。
应对模型局限性：通过知识层注入特定领域知识（如 API 索引表），有效缓解了大模型在垂直领域的幻觉问题，拓展了 LLM 在专业工具调用和复杂任务处理中的适用边界。

总之，在 LLM 能力溢出的当下，提示词工程的核心已从“如何问”转变为“如何构建可维护、可迭代的指令系统”。这套五层架构规范为开发者提供了一套标准化的方法论，有助于在更多高风险、高复杂度的场景中规模化部署 AI 能力。

查看原文 →linux.do