Agent SkillLINUX DO · AI·1 小时前

2026年GPT仍缺Claude3.7式的意图判断能力

原标题：2026了， gpt 也没学会 claude3.7 朴实无华的意图判断。

速览

该帖分享了一种通过配置Agent Skill来增强AI意图理解能力的技巧。核心在于让Codex在执行任务前先提炼用户真实目标，而非机械复述表面措辞。这种方法旨在解决GPT等模型在复杂任务中缺乏深层语义理解、过度顺从用户不合理指令的问题，从而提供更符合业务逻辑和最佳实践的结果。

AI 深度解读

背景

在 AI 辅助开发与应用生成的日常实践中，开发者（文中戏称为“彦祖”）常面临一个痛点：大型语言模型（如 GPT 系列）往往表现得像一个“无情的执行机器”。这种表现通常源于模型对用户指令的过度字面理解、机械复述或盲目顺从。

尽管模型能力日益强大，但在处理复杂、模糊或带有特定业务语境的任务时，它们容易陷入“为了听话而听话”的陷阱，导致输出结果虽然符合字面要求，却偏离了用户的真实业务目标。例如，在编写用户界面文案时暴露内部技术实现细节，或在代码调试时依赖宽泛的关键词搜索而非具体的证据链。

为了解决这一“意图与执行脱节”的问题，一位来自 LINUX DO 社区的开发者分享了一套基于 Codex 的工作流配置。这套配置通过定义特定的 Skill（技能）和 Agent 行为准则，强制模型在执行任何任务前先进行深度的“意图判断”，从而让 AI 从单纯的指令执行者转变为具备业务理解力的智能助手。

核心内容

该分享的核心在于通过修改 Codex 的配置文件，植入一套名为 intent-first（意图优先）的思维框架。这套框架旨在纠正模型在理解用户请求时的偏差，确保其输出结果真正服务于用户的最终目标，而非仅仅是对用户表面措辞的机械响应。

1. 定义 `intent-first` Skill

在 ~/.codex/skills/intent-first/SKILL.md 文件中，定义了一个通用的技能模块。该模块适用于代码编写、产品设计、UI 文案、数据建模、工作流规划、代码审查及模糊请求等所有需要理解用户意图的场景。

其核心原则包括：

先理解，后执行：在采取行动前，必须明确用户想要达成的真实结果。
区分线索与方案：用户的表面措辞、例子、类比、临时命名和初步方案仅是理解意图的线索，绝不等于最终的实现结构或文案。
拒绝机械顺从：禁止为了显得“听话”而机械复制用户表达，禁止过度顺从明显不合理、低效、高风险或不符合当前语境的方案。
结果导向的理解：真正的理解应体现在最终结果中，即提炼目标、判断语境、尊重项目事实和最佳实践，并对结果负责。

2. 规范用户可见文案

针对面向最终用户的文案（如按钮、菜单、表单说明、Toast 提示、空状态、页面标题等），该配置提出了严格的约束：

面向行为与结果：文案应说明用户能完成什么动作或将得到什么结果。
禁止暴露内部细节：严禁暴露内部实现逻辑、信息架构、组件形态、操作来源或开发视角。文案应服务于真实用户行为和业务结果，而非技术实现。

3. 规范代码调查与问题定位

在进行代码调查或 Bug 定位时，强调基于证据的逻辑链条：

具体证据优先：必须从文件路径、错误栈、路由、表名、类型名、函数名、字段名、唯一文案及真实调用关系等具体实体出发。
禁止宽泛关键词依赖：严禁用临时枚举的宽泛语义词替代语义分析和证据链追踪。
搜索策略：grep 或 search 应服务于已建立的调查路径。优先搜索具体实体；宽泛词仅用于早期探索，不能作为结论依据。命中或未命中宽泛词均不代表真实关系的存在或不存在。

4. 优化输出格式与自检机制

隐性意图判断：除非用户明确要求解释，否则不要将意图判断过程固化为特定的输出格式。应将判断逻辑内化，直接体现在更合理的执行结果中。若需说明，仅简短阐述关键判断。
快速自检清单：在执行过程中，模型需快速进行以下自我核查：
- 真实目标是什么？
- 哪些只是表达线索？
- 哪个方案更符合事实、语境和最佳实践？
- 调查依据是否来自具体线索和真实关系，而非宽泛词命中？
- 用户可见表达是否面向行为和结果，而非内部结构？
- 结果是否比复述、照抄或盲从更接近用户目标？

5. 全局 Agent 配置

在 ~/.codex/AGENTS.md 中，将上述原则提升为全局 Agent 行为准则：

默认触发：凡涉及理解、判断、取舍、编辑、实现、调查、解释或 Review 的任务，默认使用 intent-first skill。
例外情况：纯读取、复制、运行明确命令等无需额外触发意图判断的任务除外。

关键要点

意图优先原则：AI 不应是字面指令的复读机，而应是用户真实目标的解读者。表面措辞、例子和临时命名仅为线索，需通过语义分析转化为最终方案。
去技术化文案：面向用户的界面文案必须“说人话”，聚焦于用户行为和业务结果，严禁将内部技术实现、组件结构或开发视角暴露给用户。
证据链驱动调试：代码调查必须基于具体的技术实体（路径、栈、函数名等）构建证据链，严禁依赖宽泛关键词的模糊匹配作为结论依据。
隐性逻辑输出：意图判断过程应内化于执行结果中，避免冗余的解释性输出，除非用户明确要求。
批判性顺从：AI 应具备判断用户方案合理性的能力，对于低效、高风险或不符合语境的指令，应拒绝机械执行，选择更符合最佳实践的替代方案。
结构化自检：通过预设的六个维度（目标、线索、方案、依据、表达、结果）进行执行前自检，确保输出质量。

意义与影响

这一分享反映了 AI 应用从“功能可用”向“体验可用”和“智能可用”演进的趋势。

提升 AI 的“情商”与业务理解力：通过引入 intent-first 机制，AI 能够超越字面意义，捕捉用户背后的业务诉求。这解决了长期存在的“AI 听不懂人话”或“AI 过于死板”的问题，使 AI 在复杂任务中表现得更加成熟和可靠。
优化用户体验（UX）：特别是在 UI 文案生成方面，强制要求“去技术化”和“结果导向”，直接提升了生成内容的用户友好度，减少了因 AI 暴露内部逻辑而导致的用户困惑。
提高开发效率与代码质量：在代码调试和调查中，强调证据链而非关键词匹配，有助于减少误报和无效搜索，使 AI 成为更精准的辅助工具，而非干扰源。
工作流标准化的启示：该方案展示了如何通过配置文件（Skill/Agent 定义）来标准化 AI 的行为模式。这种方法可复用于其他开发工具或平台，为构建更智能、更可控的 AI 辅助工作流提供了可操作的范本。

总之，这不仅是一个提示词技巧，更是一种将人类工程思维（如最佳实践、证据链、用户体验设计）注入 AI 行为准则的方法论，旨在让 AI 从“执行机器”进化为“智能伙伴”。

查看原文 →linux.do