工作流skill:编程先写文档再执行并生成总结
速览
该skill是一种基于文档的编程plan模式,用户调用后AI先生成执行文档,审核通过后执行并记录问题,最后生成总结文档。其优点包括减少AI幻觉、支持分阶段执行、可用贵模型计划便宜模型执行,以及可多次迭代执行。目标是通过积累总结文档形成可复用的知识库,提升编程效率与质量。
AI 深度解读
背景
在 AI 辅助编程的实践中,许多用户发现直接使用“plan”模式(即让 AI 先生成计划再执行)虽然比一次性生成更稳定,但结果仍常常差强人意——AI 容易产生幻觉、上下文溢出导致工作中断、生成质量如同“抽盲盒”。针对这些痛点,LINUX DO 社区的一位用户开源了一个名为 task-planner 的 AI skill,旨在通过“文档先行”的方式,让用户以更可控、更可复用的流程完成编程任务。该帖子属于社区开源推广帖,作者已按要求标记开源推广、保证完全开源并链接社区。
核心内容
task-planner 是一个专注于编程的 AI 工作流(skill),其核心理念是以文档形式维护整个编程过程,将传统的“AI 直接生成代码”替换为三个严格的文档阶段:执行文档(perWork)、执行记录(needTodo)和总结文档。具体使用流程如下:
-
调用 skill 并输入需求
用户先调用该 skill,将编程需求告知 AI。作者习惯将需求提前写成一个文档,直接提供给 AI。 -
生成并审核执行文档(perWork)
AI 根据需求生成一份详细的执行文档(perWork),描述实现步骤、技术细节、预期输出等。用户需要仔细审核这份文档,并根据自己的理解进行修改,直到满意为止。修改完成后,将 perWork 文档的状态标记为“审核通过”。 -
AI 执行执行文档
用户指示 AI 按照已审核通过的 perWork 执行。AI 会先创建一个 needTodo 文档,记录自己的执行撞库情况(如遇到的技术难点、依赖冲突等),以及执行过程中遇到的问题。然后 AI 才开始正式生成代码或其他产出。最后,AI 会自动生成一份总结文档,用于积累知识和方便后续复用。 -
审查生成结果
用户审查 AI 生成的代码以及 needTodo 文档。needTodo 文档中还包含需要用户手动执行的操作(如配置环境变量、安装依赖)以及可参考的验证步骤。用户可据此对最终产出进行验收。
这个 skill 的核心优势在于文档驱动:
- 减少幻觉:由于执行文档由用户审核并纠正过,AI 在后续执行中产生幻觉的概率大幅降低,产出更可靠。
- 断点续接:如果 AI 在生成过程中上下文已满(如长任务中断),用户可以新开一个对话,重新调用 skill 并告诉 AI 之前已审核通过的 perWork 文档即可继续,无需从头开始。
- 成本控制:用户可以用价格较高的模型(如 GPT-4)生成计划,用更便宜的模型(如 Claude 3 Haiku)执行具体任务,灵活平衡质量与成本。
- 可反复尝试:如果对某次生成的代码不满意,只需修改 perWork 文档,再新开一个对话重新执行即可。作者调侃这就像“抽盲盒”,可能下一次生成就更满意。
作者在实际工作中已稳定使用此工作流,强调只要认真阅读并修改 AI 生成的执行文档,最终产出的代码几乎不会出现不可用的情况。他还计划在未来优化总结文档流程,形成成熟的知识库以方便复用。
关键要点
- 文档是核心:perWork(执行文档)是用户与 AI 之间可信的“契约”,审核通过后 AI 严格依此执行,避免自由发挥。
- 双文档机制:needTodo 文档记录执行中的问题和手动操作,总结文档用于知识沉淀,构建可复用的编程经验库。
- 断点续接能力:上下文溢出时可新开对话,基于同一份 perWork 继续,无需重头开始。
- 成本与质量分离:计划阶段可用昂贵模型,执行阶段可用便宜模型,实现成本优化。
- 试错友好:不满意即修改 perWork 重新执行,迭代成本低,类似于“重新抽签”但更有方向。
- 用户反馈:作者实测效果稳定,比传统 plan 模式更可靠,尤其适合复杂或长链路的编程任务。
意义与影响
task-planner 工作流在实操层面解决了 AI 编程中几个常见痛点:幻觉、上下文溢出、不可控和低复用性。它通过将人类审核引入执行文档环节,把 AI 从“自主规划者”降级为“执行者”,从而大幅提升结果的可预期性。这种“文档驱动+人机校对”的模式,本质上是在缺乏完全可靠的 AI 规划能力时,用人类的理性来弥合 AI 的随机性。
对于个人开发者或团队而言,这一 skill 提供了一种廉价、易上手的方法来沉淀编程知识:每次任务生成的总结文档可以逐步积累,最终形成团队内部的知识库,减少重复劳动。同时,支持不同模型混用的思路也为成本敏感的用户提供了实际参考。
从更广阔的角度看,task-planner 代表了 AI 辅助编程从“自由对话”向“结构化工作流”演进的一种探索。它不追求一次性完美,而是通过可重复、可审核的流程来逼近高质量输出。如果作者后续完善总结文档的自动知识库化,该 skill 甚至可能演变为一种轻量级的自动化文档系统,在 LINUX DO 等社区中引发更多类似实践。
当然,该 skill 的有效性高度依赖于用户愿意花时间审核和修改执行文档——如果用户跳过审核直接执行,效果可能与普通 plan 模式无异。所以它更适合有一定技术判断力、追求稳定产出的开发者。总体而言,task-planner 是一次实用且开源的创新,为社区提供了可实践的 AI 编程新范式。
