Agent SkillLINUX DO · AI·2 小时前

分享用Codex和Claude构建AI增强记忆的工作流

原标题：【开发调优】分享自己用Codex和Claude的增强AI记忆的工作流

速览

针对Vibecoding中长项目易失忆、越权等痛点，作者提出外包“记忆系统”的工作流。核心包括制定项目基本法明确边界、建立项目地图指引路径、通过Harness安检控制操作权限，以及利用RAG精准过滤无关信息。该方案旨在让AI在长线开发中保持专注，避免将过期废稿或临时方案误作当前任务。

AI 深度解读

深度解读：构建 AI 长效记忆与可控工作流

背景

在“沉浸式 AI 编程”（Vibecoding）日益普及的今天，开发者普遍面临一个核心痛点：如何让 AI 在长线项目中保持“记忆”，避免失忆、跑题或基于过期信息执行错误操作。

许多开发者曾天真地认为，只要模型的上下文窗口（Context Window）足够大，就能解决信息过载和逻辑混乱的问题。然而，随着项目复杂度提升，旧文档、新任务、历史测试、临时方案及外部建议交织在一起，极易导致 AI 混淆“曾经出现过的东西”与“当前应执行的任务”。此外，AI 往往因“太积极”而越权执行，或把废弃逻辑误认为主线任务。

作者基于实际经验指出，单纯依赖模型的内部记忆是不可靠的。真正的解决方案是将 AI 的“记忆系统”外包给一套结构化的工作流，通过强制对齐项目规则、任务边界和当前状态，确保 AI 在既定框架内高效运行。这套方法论不依赖特定模型，适用于 Codex、Claude 等主流 AI 编程助手。

核心内容

作者提出了一套完整的 AI 编程工作流，旨在通过外部系统化管理 AI 的行为与记忆，具体包含以下十个关键环节：

1. 规则文件：确立“项目基本法”

在长项目启动前，必须创建一份规则文件（如 AGENTS.md、CLAUDE.md 或 AI_RULES.md）。这份文件并非给人看的文档，而是给 AI 设定的底层思想钢印。它需明确：

项目的核心目标与当前主线任务。
历史遗留问题与当前无关项的区分。
绝对不可修改的核心文件及高危操作的红线。
测试流程、发布流程及外部建议的处理原则。此举解决了每次开启新对话时需重复解释背景的问题，确保 AI 进入项目时即理解运行法则。

2. 新项目开荒：AI 起草，人类拍板

对于新项目，不直接让 AI 写代码，而是先让 AI 起草规则文件草案。AI 需按照预设骨架（包括目标、主线、非目标、优先级、可编辑/禁止区域、批次规则、测试验证、发布门禁、交接格式等）生成内容。

关键动作：人类开发者必须亲自修改并拍板最终规则。这不仅是给 AI 的指令，更是确立人机协作的边界。

3. 项目地图：空间索引

单独维护一份“项目地图”，清晰标注页面入口、核心模块、脚本/测试/配置位置、高风险区及纯文档区域。

价值：防止 AI 在无头苍蝇式乱翻中越界操作或误用废弃逻辑，引导 AI 走“正门”，提高检索效率。

4. Harness（门禁）：开工前安检

在 AI 动手前，通过 Harness 机制进行强制检查。AI 需自我确认：

任务层级（文档、代码、测试、发布）。
允许与禁止操作的文件/命令/网络访问权限。
是否混合了多个任务。
原则：拿不准则不干。防止 AI 因“勤快”而擅自重构模块或执行未授权操作。

5. RAG（检索增强生成）：精准过滤而非全量注入

反对将所有资料一股脑塞入上下文。RAG 的核心价值在于“过滤得准”。

策略：仅投放当前任务所需的资料，剔除废弃方案、过期报告、临时实验及外部审查意见等“垃圾信息”。
目的：防止 AI 被污染，避免将旧方案误认为主线。

6. 小步快跑：任务拆解与隔离

拒绝一次性下达“全搞定”指令。将长任务拆解为不同层级（L0-L5）：

L0：只读审计。
L1：小范围修改。
L2：针对性测试。
L3：全量测试。
L4：预发布/线上验证。
L5：发布决策。每批次需明确目标、允许范围、通过标准及失败止损点。小批次执行能确保问题即时定位，避免后期排错灾难。

7. 决策报告：历史包袱清理

定期让 AI 对堆积的历史材料进行分类处理：

Keep（保留）、Rewrite（重写）、Defer（延后）、Discard（丢弃）、Blocked（阻塞）。
目的：防止 AI 因“以前出现过=现在还要干”的线性思维被历史残骸拖慢节奏。

8. Closure（交接条）：跨会话连戏

每轮任务结束后，AI 必须生成标准化的交接条，包含：

Changed Files（修改文件）、Checks Run（运行检查）、Skipped Gates（跳过门禁及原因）、Self-Audit（自我审计风险）、Remaining Risks（剩余风险）、Next Allowed Step（下一步允许操作）。
价值：实现跨会话、跨上下文甚至跨模型的无缝衔接，比翻找聊天记录更高效。

9. 测试：规矩的校验

将部分规则转化为测试代码（如禁止触碰特定文件、禁止泄露内部词汇、禁止绕过门禁）。测试不仅是验证功能，更是作为护栏，在 AI 越界时将其强行拉回。

10. 完整工作流闭环

作者推荐的顺遂流程为：新项目开荒 -> 起草规则 -> 人类拍板 -> 建立地图 -> Harness 安检 -> RAG 筛选资料 -> AI 制定小批次计划 -> 人类确认 -> AI 执行 -> 测试 -> 生成 Closure -> 进入下一批。

关键要点

记忆外包：AI 的长效记忆不应依赖模型内部权重或无限长的上下文，而应外包给结构化的外部系统（规则文件、地图、交接条等）。
人类主导权：AI 负责出谋划策、执行推演和提供建议，但方向盘、拍板权、发布决策及高危操作权限必须牢牢掌握在人类手中。
边界清晰：通过 AGENTS.md 等规则文件和 Harness 机制，明确界定“做什么”、“不做什么”以及“哪里不能碰”，防止 AI 越权。
信息降噪：RAG 的核心是精准投放与垃圾过滤，而非数据堆砌。过多的无关信息会导致 AI 逻辑混乱。
小步迭代：将大任务拆解为 L0-L5 的小批次，每次只解决单一层级问题，便于快速定位错误和控制风险。
状态持久化：利用 Closure（交接条）记录每轮任务的上下文、风险点和下一步计划，确保 AI 在断点续传时能准确“接戏”。
交叉验证：可借助 Mimo 等其他大模型对计划进行交叉“找茬”，但最终决策仍需回归到人类制定的规则体系中。

意义与影响

这套工作流重新定义了人机协作在软件开发中的边界。它打破了“AI 编程即全自动”的幻想，确立了“人定方向，AI 跑执行；人做决策，AI 做推演”的新范式。

其核心价值在于将 AI 从不可控的“黑盒”转变为可预测、可审计、可追溯的“智能组件”。通过建立基本法、地图、门禁和交接机制，开发者能够显著降低 AI 引入的维护成本和潜在风险，使长线项目的开发更加稳健。

最终，这种模式证明了 Vibecoding 的最高境界并非放任 AI 自由发挥，而是通过严密的系统设计，让 AI 在人类画好的圈子里高效加速。这不仅提升了开发效率，更保障了代码库的安全性与项目的可控性，为 AI 辅助编程在复杂工程场景中的落地提供了可复制的方法论。

查看原文 →linux.do