开源OMH工作流:利用Harness理念节省Codex编程额度
速览
OMH是一个基于GitHub PR的轻量化Harness工作流,旨在优化AI编程流程并节省订阅额度。该工作流将开发过程解耦为信息收集、计划制定、代码实现和审查四个阶段,并针对不同阶段匹配最合适的模型(如Web端5.5模型用于只读分析,次旗舰模型用于代码实现)。通过避免在Codex中进行非必要的上下文交互和审查,有效降低了Token消耗,提升了开发效率。
AI 深度解读
深度解读:OMH —— 基于 Harness 理念的轻量化编程工作流
背景
随着 AI 编程助手(如 Codex、OpenCode 等)的普及,开发者面临着订阅成本高昂、Token 消耗过快以及代码质量不稳定等痛点。传统的“Vibe Coding”(氛围编程)往往缺乏严谨的工程结构,导致上下文污染、返工率高,进而加剧了 Token 的浪费。
在此背景下,社区开发者推出了一款名为 OMH (Oh My Harness) 的开源工作流。该工作流基于 Harness 理念设计,旨在通过解耦编程的不同阶段,合理利用不同平台(如 Web 端与本地客户端)的资源特性,实现轻量级、低成本且高质量的代码开发。OMH 目前主要支持 Codex 和 OpenCode,并鼓励社区通过 PR 进行扩展。
核心内容
OMH 的核心逻辑在于将编程过程分解为四个明确的阶段,并通过特定的 Skill(技能/指令)来规范 Agent 的行为,从而优化资源分配。
1. 架构与 Skill 设计
OMH 仅包含四个核心 Skill,分为“核心”与“辅助”两类:
-
核心 Skill:
harness定义了标准的开发循环:- 收集信息 (只读):获取任务相关上下文。
- 制定 Plan (计划可写):生成清晰、单一目标的开发计划。
- 实现 Plan (代码可写):根据 Plan 编写代码。
- 审查实现 (只读):检查代码是否符合 Plan 和需求。
- 反馈调整:根据审查结果回到前序阶段进行修正。
-
辅助 Skill
- TDD Skill:源自
mattpocock的修改版,提供测试驱动开发策略。 - Debug & Review Skills:源自
superpowers的systematic-debugging和receiving-code-review的适配版本,提供系统化的调试能力和接受代码审查的机制。
- TDD Skill:源自
2. 开发理念与实践
OMH 的诞生基于以下开发哲学:
- Plan 的明确性与单一性: 借鉴 GitHub PR(Pull Request)的开发模式,每个 Plan 应清晰明确,最佳策略是“一次 Plan 只做一件事”。虽然可以将多个小任务打包,但子任务必须界限分明。
- 分支开发 (Worktrees): 放弃在主分支直接修改,转而使用分支进行开发。这不仅保护了主分支的稳定性,还支持清晰的并发开发(如不同模块独立分支),并便于回退。
- 上下文纯净度 (Context Purity):
- 知彼:任务开始前,由主 Agent 收集信息,子 Agent 补充,确保上下文的最纯净状态,避免信息过载导致的“坑”。
- 知己:开发者需明确 Agent 的能力边界、协作方式及潜在陷阱。
- 多 Agent 的合理使用: 反对无意义的多 Agent 讨论(可能导致“三个臭皮匠”效应,即结果更混乱)。多 Agent 仅应用于特定场景,如分工审查(一个查 Bug,一个查静默失败)或并行信息搜集。
- 测试驱动反馈: 利用 Agent 的 React 特性,构建自我反馈的测试工具(如 E2E 测试),使 Agent 能自动发现并修复问题。
- 模型分层策略:
- 计划阶段:需要强大的模型进行逻辑推演。
- 实现阶段:次旗舰模型即可,注重效率。
- 审查阶段:需要偏好审查的模型,而非单纯擅长写代码的旗舰模型。
3. 成本优化策略:解耦与资源复用
这是 OMH 最具价值的部分,旨在最大化利用订阅权益(以 ChatGPT Plus 为例):
-
痛点分析:
- Plan 阶段消耗大:Web 端对话导致上下文变长,Token 消耗剧增。
- 返工消耗:缺乏 Harness 规范导致代码质量差,引发返工。
- Review 冷启动:本地 Review 需重新加载上下文,造成额外花费。
- 实现阶段:在清晰 Plan 下,实现阶段的 Token 消耗是必要且可控的。
-
优化方案:只读操作移出 Codex
- 阶段 1 & 2 (收集与 Plan): 利用 Web 端(如 GPT Web、Claude Web、Grok)慷慨的免费/高额度模型(如 GPT 5.5 Web 端),通过 GitHub 连接器读取私有仓库代码。生成 PR 和详细的 Plan。注意:不建议 Web 端直接修改代码(因无法 Patch,只能重写,质量低),仅用于分析和生成 Plan。
- 阶段 3 (实现):
在本地 Codex/OpenCode 中,使用
$harness接手 PR 任务。拉取分支,读取 Plan,进行信息确认后开始编码。此时可选用次旗舰模型(如 GPT 5.4,其额度通常是 5.5 的两倍;或 GPT 5.3 Codex、DS 模型)以降低成本。 - 阶段 4 (审查): 利用云端 Codex Review 功能。Codex Review 由 GPT 5.3 Codex 驱动,拥有独立的额度池(每周 3000 次调用,5 小时限制),不与本地 Codex 额度共享。本地 Agent 只需等待云端审查结果(通常 10 分钟内),无需消耗本地 Token。
关键要点
- 工作流核心:OMH 通过
harnessSkill 强制实施“收集-计划-实现-审查”的闭环,确保开发过程可控。 - 资源解耦:将“只读/分析”任务(Plan 阶段)移至 Web 端,将“代码修改”任务(实现阶段)移至本地,将“代码审查”任务移至云端 Review 服务,实现各平台优势最大化。
- 模型选型策略:
- Plan 阶段:使用 Web 端高额度模型(如 GPT 5.5 Web)。
- 实现阶段:使用本地次旗舰模型(如 GPT 5.4 或更便宜的模型)。
- 审查阶段:使用云端 Codex Review(独立额度,不占本地配额)。
- 开发规范:
- 坚持 PR 式开发,每个 PR 对应清晰单一的目标。
- 使用分支(Worktrees)进行开发,避免污染主分支。
- 优先收集纯净上下文,避免多 Agent 无效讨论。
- 技术实现:
- 初始化命令:
npx @doraemon-hug-u/oh-my-harness。 - 支持平台:目前支持 Codex 和 OpenCode,架构设计允许扩展至其他平台。
- 依赖 Skill:整合了
mattpocock的 TDD 和superpowers的 Debug/Review 技能。
- 初始化命令:
意义与影响
OMH 工作流为 AI 辅助编程提供了一套可落地的工程化解决方案。它不仅仅是一个工具,更是一种**“AI 原生软件工程”**的实践范式:
- 降低经济门槛:通过精细化的 Token 管理和订阅权益复用,使得个人开发者或小型团队能够以更低的成本使用高级 AI 编程能力,让“订阅物尽其用”。
- 提升代码质量:通过强制的 Harness 循环和明确的 Plan 机制,减少了 AI 生成代码的随机性和幻觉,提高了代码与需求的对齐度。
- 推动社区协作:作为开源项目,OMH 鼓励社区贡献 PR 和 Skill 适配,有助于形成标准化的 AI 开发工作流最佳实践。
- 启发后续工具设计:其“解耦阶段”和“
