分享用Codex和Claude构建AI增强记忆的工作流
速览
针对Vibecoding中长项目易失忆、越权等痛点,作者提出外包“记忆系统”的工作流。核心包括制定项目基本法明确边界、建立项目地图指引路径、通过Harness安检控制操作权限,以及利用RAG精准过滤无关信息。该方案旨在让AI在长线开发中保持专注,避免将过期废稿或临时方案误作当前任务。
AI 深度解读
深度解读:构建 AI 长效记忆与可控工作流
背景
在“沉浸式 AI 编程”(Vibecoding)日益普及的今天,开发者普遍面临一个核心痛点:如何让 AI 在长线项目中保持“记忆”,避免失忆、跑题或基于过期信息执行错误操作。
许多开发者曾天真地认为,只要模型的上下文窗口(Context Window)足够大,就能解决信息过载和逻辑混乱的问题。然而,随着项目复杂度提升,旧文档、新任务、历史测试、临时方案及外部建议交织在一起,极易导致 AI 混淆“曾经出现过的东西”与“当前应执行的任务”。此外,AI 往往因“太积极”而越权执行,或把废弃逻辑误认为主线任务。
作者基于实际经验指出,单纯依赖模型的内部记忆是不可靠的。真正的解决方案是将 AI 的“记忆系统”外包给一套结构化的工作流,通过强制对齐项目规则、任务边界和当前状态,确保 AI 在既定框架内高效运行。这套方法论不依赖特定模型,适用于 Codex、Claude 等主流 AI 编程助手。
核心内容
作者提出了一套完整的 AI 编程工作流,旨在通过外部系统化管理 AI 的行为与记忆,具体包含以下十个关键环节:
1. 规则文件:确立“项目基本法”
在长项目启动前,必须创建一份规则文件(如 AGENTS.md、CLAUDE.md 或 AI_RULES.md)。这份文件并非给人看的文档,而是给 AI 设定的底层思想钢印。它需明确:
- 项目的核心目标与当前主线任务。
- 历史遗留问题与当前无关项的区分。
- 绝对不可修改的核心文件及高危操作的红线。
- 测试流程、发布流程及外部建议的处理原则。 此举解决了每次开启新对话时需重复解释背景的问题,确保 AI 进入项目时即理解运行法则。
2. 新项目开荒:AI 起草,人类拍板
对于新项目,不直接让 AI 写代码,而是先让 AI 起草规则文件草案。AI 需按照预设骨架(包括目标、主线、非目标、优先级、可编辑/禁止区域、批次规则、测试验证、发布门禁、交接格式等)生成内容。
- 关键动作:人类开发者必须亲自修改并拍板最终规则。这不仅是给 AI 的指令,更是确立人机协作的边界。
3. 项目地图:空间索引
单独维护一份“项目地图”,清晰标注页面入口、核心模块、脚本/测试/配置位置、高风险区及纯文档区域。
- 价值:防止 AI 在无头苍蝇式乱翻中越界操作或误用废弃逻辑,引导 AI 走“正门”,提高检索效率。
4. Harness(门禁):开工前安检
在 AI 动手前,通过 Harness 机制进行强制检查。AI 需自我确认:
- 任务层级(文档、代码、测试、发布)。
- 允许与禁止操作的文件/命令/网络访问权限。
- 是否混合了多个任务。
- 原则:拿不准则不干。防止 AI 因“勤快”而擅自重构模块或执行未授权操作。
5. RAG(检索增强生成):精准过滤而非全量注入
反对将所有资料一股脑塞入上下文。RAG 的核心价值在于“过滤得准”。
- 策略:仅投放当前任务所需的资料,剔除废弃方案、过期报告、临时实验及外部审查意见等“垃圾信息”。
- 目的:防止 AI 被污染,避免将旧方案误认为主线。
6. 小步快跑:任务拆解与隔离
拒绝一次性下达“全搞定”指令。将长任务拆解为不同层级(L0-L5):
- L0:只读审计。
- L1:小范围修改。
- L2:针对性测试。
- L3:全量测试。
- L4:预发布/线上验证。
- L5:发布决策。 每批次需明确目标、允许范围、通过标准及失败止损点。小批次执行能确保问题即时定位,避免后期排错灾难。
7. 决策报告:历史包袱清理
定期让 AI 对堆积的历史材料进行分类处理:
- Keep(保留)、Rewrite(重写)、Defer(延后)、Discard(丢弃)、Blocked(阻塞)。
- 目的:防止 AI 因“以前出现过=现在还要干”的线性思维被历史残骸拖慢节奏。
8. Closure(交接条):跨会话连戏
每轮任务结束后,AI 必须生成标准化的交接条,包含:
- Changed Files(修改文件)、Checks Run(运行检查)、Skipped Gates(跳过门禁及原因)、Self-Audit(自我审计风险)、Remaining Risks(剩余风险)、Next Allowed Step(下一步允许操作)。
- 价值:实现跨会话、跨上下文甚至跨模型的无缝衔接,比翻找聊天记录更高效。
9. 测试:规矩的校验
将部分规则转化为测试代码(如禁止触碰特定文件、禁止泄露内部词汇、禁止绕过门禁)。测试不仅是验证功能,更是作为护栏,在 AI 越界时将其强行拉回。
10. 完整工作流闭环
作者推荐的顺遂流程为: 新项目开荒 -> 起草规则 -> 人类拍板 -> 建立地图 -> Harness 安检 -> RAG 筛选资料 -> AI 制定小批次计划 -> 人类确认 -> AI 执行 -> 测试 -> 生成 Closure -> 进入下一批。
关键要点
- 记忆外包:AI 的长效记忆不应依赖模型内部权重或无限长的上下文,而应外包给结构化的外部系统(规则文件、地图、交接条等)。
- 人类主导权:AI 负责出谋划策、执行推演和提供建议,但方向盘、拍板权、发布决策及高危操作权限必须牢牢掌握在人类手中。
- 边界清晰:通过
AGENTS.md等规则文件和 Harness 机制,明确界定“做什么”、“不做什么”以及“哪里不能碰”,防止 AI 越权。 - 信息降噪:RAG 的核心是精准投放与垃圾过滤,而非数据堆砌。过多的无关信息会导致 AI 逻辑混乱。
- 小步迭代:将大任务拆解为 L0-L5 的小批次,每次只解决单一层级问题,便于快速定位错误和控制风险。
- 状态持久化:利用 Closure(交接条)记录每轮任务的上下文、风险点和下一步计划,确保 AI 在断点续传时能准确“接戏”。
- 交叉验证:可借助 Mimo 等其他大模型对计划进行交叉“找茬”,但最终决策仍需回归到人类制定的规则体系中。
意义与影响
这套工作流重新定义了人机协作在软件开发中的边界。它打破了“AI 编程即全自动”的幻想,确立了“人定方向,AI 跑执行;人做决策,AI 做推演”的新范式。
其核心价值在于将 AI 从不可控的“黑盒”转变为可预测、可审计、可追溯的“智能组件”。通过建立基本法、地图、门禁和交接机制,开发者能够显著降低 AI 引入的维护成本和潜在风险,使长线项目的开发更加稳健。
最终,这种模式证明了 Vibecoding 的最高境界并非放任 AI 自由发挥,而是通过严密的系统设计,让 AI 在人类画好的圈子里高效加速。这不仅提升了开发效率,更保障了代码库的安全性与项目的可控性,为 AI 辅助编程在复杂工程场景中的落地提供了可复制的方法论。
