← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

2026年GPT仍缺Claude3.7式的意图判断能力

原标题:2026了, gpt 也没学会 claude3.7 朴实无华的意图判断。

速览

该帖分享了一种通过配置Agent Skill来增强AI意图理解能力的技巧。核心在于让Codex在执行任务前先提炼用户真实目标,而非机械复述表面措辞。这种方法旨在解决GPT等模型在复杂任务中缺乏深层语义理解、过度顺从用户不合理指令的问题,从而提供更符合业务逻辑和最佳实践的结果。

AI 深度解读

背景

在 AI 辅助开发与应用生成的日常实践中,开发者(文中戏称为“彦祖”)常面临一个痛点:大型语言模型(如 GPT 系列)往往表现得像一个“无情的执行机器”。这种表现通常源于模型对用户指令的过度字面理解、机械复述或盲目顺从。

尽管模型能力日益强大,但在处理复杂、模糊或带有特定业务语境的任务时,它们容易陷入“为了听话而听话”的陷阱,导致输出结果虽然符合字面要求,却偏离了用户的真实业务目标。例如,在编写用户界面文案时暴露内部技术实现细节,或在代码调试时依赖宽泛的关键词搜索而非具体的证据链。

为了解决这一“意图与执行脱节”的问题,一位来自 LINUX DO 社区的开发者分享了一套基于 Codex 的工作流配置。这套配置通过定义特定的 Skill(技能)和 Agent 行为准则,强制模型在执行任何任务前先进行深度的“意图判断”,从而让 AI 从单纯的指令执行者转变为具备业务理解力的智能助手。

核心内容

该分享的核心在于通过修改 Codex 的配置文件,植入一套名为 intent-first(意图优先)的思维框架。这套框架旨在纠正模型在理解用户请求时的偏差,确保其输出结果真正服务于用户的最终目标,而非仅仅是对用户表面措辞的机械响应。

1. 定义 intent-first Skill

~/.codex/skills/intent-first/SKILL.md 文件中,定义了一个通用的技能模块。该模块适用于代码编写、产品设计、UI 文案、数据建模、工作流规划、代码审查及模糊请求等所有需要理解用户意图的场景。

其核心原则包括:

  • 先理解,后执行:在采取行动前,必须明确用户想要达成的真实结果。
  • 区分线索与方案:用户的表面措辞、例子、类比、临时命名和初步方案仅是理解意图的线索,绝不等于最终的实现结构或文案。
  • 拒绝机械顺从:禁止为了显得“听话”而机械复制用户表达,禁止过度顺从明显不合理、低效、高风险或不符合当前语境的方案。
  • 结果导向的理解:真正的理解应体现在最终结果中,即提炼目标、判断语境、尊重项目事实和最佳实践,并对结果负责。

2. 规范用户可见文案

针对面向最终用户的文案(如按钮、菜单、表单说明、Toast 提示、空状态、页面标题等),该配置提出了严格的约束:

  • 面向行为与结果:文案应说明用户能完成什么动作或将得到什么结果。
  • 禁止暴露内部细节:严禁暴露内部实现逻辑、信息架构、组件形态、操作来源或开发视角。文案应服务于真实用户行为和业务结果,而非技术实现。

3. 规范代码调查与问题定位

在进行代码调查或 Bug 定位时,强调基于证据的逻辑链条:

  • 具体证据优先:必须从文件路径、错误栈、路由、表名、类型名、函数名、字段名、唯一文案及真实调用关系等具体实体出发。
  • 禁止宽泛关键词依赖:严禁用临时枚举的宽泛语义词替代语义分析和证据链追踪。
  • 搜索策略grepsearch 应服务于已建立的调查路径。优先搜索具体实体;宽泛词仅用于早期探索,不能作为结论依据。命中或未命中宽泛词均不代表真实关系的存在或不存在。

4. 优化输出格式与自检机制

  • 隐性意图判断:除非用户明确要求解释,否则不要将意图判断过程固化为特定的输出格式。应将判断逻辑内化,直接体现在更合理的执行结果中。若需说明,仅简短阐述关键判断。
  • 快速自检清单:在执行过程中,模型需快速进行以下自我核查:
    • 真实目标是什么?
    • 哪些只是表达线索?
    • 哪个方案更符合事实、语境和最佳实践?
    • 调查依据是否来自具体线索和真实关系,而非宽泛词命中?
    • 用户可见表达是否面向行为和结果,而非内部结构?
    • 结果是否比复述、照抄或盲从更接近用户目标?

5. 全局 Agent 配置

~/.codex/AGENTS.md 中,将上述原则提升为全局 Agent 行为准则:

  • 默认触发:凡涉及理解、判断、取舍、编辑、实现、调查、解释或 Review 的任务,默认使用 intent-first skill。
  • 例外情况:纯读取、复制、运行明确命令等无需额外触发意图判断的任务除外。

关键要点

  • 意图优先原则:AI 不应是字面指令的复读机,而应是用户真实目标的解读者。表面措辞、例子和临时命名仅为线索,需通过语义分析转化为最终方案。
  • 去技术化文案:面向用户的界面文案必须“说人话”,聚焦于用户行为和业务结果,严禁将内部技术实现、组件结构或开发视角暴露给用户。
  • 证据链驱动调试:代码调查必须基于具体的技术实体(路径、栈、函数名等)构建证据链,严禁依赖宽泛关键词的模糊匹配作为结论依据。
  • 隐性逻辑输出:意图判断过程应内化于执行结果中,避免冗余的解释性输出,除非用户明确要求。
  • 批判性顺从:AI 应具备判断用户方案合理性的能力,对于低效、高风险或不符合语境的指令,应拒绝机械执行,选择更符合最佳实践的替代方案。
  • 结构化自检:通过预设的六个维度(目标、线索、方案、依据、表达、结果)进行执行前自检,确保输出质量。

意义与影响

这一分享反映了 AI 应用从“功能可用”向“体验可用”和“智能可用”演进的趋势。

  1. 提升 AI 的“情商”与业务理解力:通过引入 intent-first 机制,AI 能够超越字面意义,捕捉用户背后的业务诉求。这解决了长期存在的“AI 听不懂人话”或“AI 过于死板”的问题,使 AI 在复杂任务中表现得更加成熟和可靠。
  2. 优化用户体验(UX):特别是在 UI 文案生成方面,强制要求“去技术化”和“结果导向”,直接提升了生成内容的用户友好度,减少了因 AI 暴露内部逻辑而导致的用户困惑。
  3. 提高开发效率与代码质量:在代码调试和调查中,强调证据链而非关键词匹配,有助于减少误报和无效搜索,使 AI 成为更精准的辅助工具,而非干扰源。
  4. 工作流标准化的启示:该方案展示了如何通过配置文件(Skill/Agent 定义)来标准化 AI 的行为模式。这种方法可复用于其他开发工具或平台,为构建更智能、更可控的 AI 辅助工作流提供了可操作的范本。

总之,这不仅是一个提示词技巧,更是一种将人类工程思维(如最佳实践、证据链、用户体验设计)注入 AI 行为准则的方法论,旨在让 AI 从“执行机器”进化为“智能伙伴”。

查看原文 →linux.do