Harness:自动化构建领域专用智能体团队与技能的元技能框架
速览
Harness 是一个元技能框架,能够自动设计针对特定领域的智能体团队,定义专业化智能体角色,并生成它们所需的执行技能。它适用于需要快速搭建定制化多智能体工作流、降低 Agent 开发门槛的场景。
AI 深度解读
这是什么
Harness 是 GitHub 上由 revfactory 维护的热门开源项目(主语言 HTML,Star 数 3709+),它是 Claude Code 生态系统中位于 L3 Meta-Factory(元工厂层) 的“团队架构工厂”。
简单来说,Harness 是一个插件,能够根据你对项目领域的自然语言描述(支持英语、韩语、日语),自动生成适配的 Agent 团队架构 和对应的 Skills(技能定义)。它不直接执行代码任务,而是负责“设计”如何组织多个 specialized agents(专用智能体)来协作完成复杂任务。
在 Claude Code 的生态分层中,Harness 处于生成其他 Harness 的元层级,具体定位为 Team-Architecture Factory(团队架构工厂)。它与同属 L3 层的 Archon(负责生成确定性运行时配置)互补,分别解决“谁来协作”和“如何运行”的问题。
解决的问题
LLM 代码代理(Code Agents)在处理单一、简单任务时表现良好,但在面对复杂、多步骤、需要多角色协作的工程任务时,往往缺乏结构化的协作机制,导致输出质量不稳定、上下文混乱或逻辑断裂。
Harness 旨在解决以下核心痛点:
- 复杂任务拆解困难:用户难以手动设计高效的 Agent 协作拓扑(如流水线、主从结构、专家池等)。
- 上下文管理低效:多 Agent 交互时,如何高效传递数据、处理错误和协调流程缺乏标准化模板。
- 领域适配成本高:为特定领域(如全栈开发、深度研究、漫画制作)定制 Agent 团队需要深厚的 Prompt Engineering 和架构设计知识。
- 输出质量方差大:缺乏结构化预配置(Structured Pre-Configuration)时,LLM 输出的质量和一致性随任务复杂度增加而显著下降。
核心功能
Harness 通过一个 6 阶段工作流,将自然语言需求转化为可执行的 Agent 团队配置:
- Domain Analysis(领域分析):解析用户的项目描述,确定任务边界和领域特性。
- Team Architecture Design(团队架构设计):从 6 种预定义的架构模式中选择合适的模式(见下文)。
- Agent Definition Generation(Agent 定义生成):自动生成
.claude/agents/目录下的 Agent 定义文件(如analyst.md,builder.md)。 - Skill Generation(技能生成):自动生成
.claude/skills/目录下的技能文件,采用 Progressive Disclosure(渐进式披露) 技术以优化上下文窗口使用。 - Integration & Orchestration(集成与编排):配置 Agent 间的数据传递、错误处理协议和团队协调机制。
- Validation & Testing(验证与测试):提供触发验证、Dry-run 测试以及“有技能 vs 无技能”的对比测试方法。
支持的 6 种团队架构模式
- Pipeline(流水线):线性任务流,前一步输出作为后一步输入。
- Fan-out/Fan-in(扇出/扇入):并行处理多个子任务,最后汇总结果。
- Expert Pool(专家池):多个专家并行工作,由主 Agent 选择最佳方案。
- Producer-Reviewer(生产者-审核者):生成内容并即时进行质量审核的循环。
- Supervisor(监督者):中央监督 Agent 分配任务并监控进度。
- Hierarchical Delegation(层级委派):多层级的任务委派结构。
亮点 / 与同类相比
1. 明确的生态定位:L3 元工厂层
Harness 不只是一个 Prompt 集合,而是 Claude Code 生态中的基础设施层。它位于 L3 层,专门负责团队架构的生成。
- 与 Archon 的区别:
Archon是 Runtime-Configuration Factory,负责生成确定性的运行时配置;Harness是 Team-Architecture Factory,负责生成 Agent 团队结构和协作协议。两者是邻居子层,可结合使用(用 Harness 设计架构,用 Archon 部署运行时)。 - 与
revfactory/harness-100的关系:后者是前者的产物库,提供了 100 个生产就绪的 Agent 团队 Harness,覆盖 10 个领域,共 200 个包。
2. 实证驱动的质量提升
根据作者进行的 A/B 测试(revfactory/claude-code-harness,n=15),使用 Harness 进行结构化预配置后:
- 平均质量提升 +60%(从 49.5 分提升至 79.3 分)。
- 胜率 15/15(在所有 15 个测试任务中均优于对照组)。
- 方差降低 -32%,表明输出更加稳定。
- 注:效果随任务复杂度增加而放大(Basic +23.8%, Advanced +29.6%, Expert +36.2%)。
3. 渐进式技能生成(Progressive Disclosure)
自动生成的 Skills 采用渐进式披露策略,仅在需要时加载详细信息,有效管理 LLM 的上下文窗口,避免信息过载。
4. 多语言支持与跨运行时潜力
- 支持英语、韩语、日语触发指令。
- 虽然当前官方运行时仅限 Claude Code,但已有社区端口如
SaehwanPark/meta-harness针对 Codex 进行了移植,展示了跨运行时协作的路线图。
适合谁用 / 上手
适合人群
- Claude Code 高级用户:希望自动化复杂工程任务的 Agent 编排,而非手动编写每个 Agent 的 Prompt。
- AI 应用架构师:需要快速原型化不同 Agent 协作模式(如监督者、流水线)以评估最佳实践。
- 特定领域开发者:如全栈开发、深度研究、内容创作(YouTube/Webtoon)、代码审查等,需要结构化团队分工的场景。
快速上手指南
-
前置条件:
- 安装 Claude Code。
- 启用实验性 Agent 团队功能:设置环境变量
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1。
-
安装插件:
# 添加插件市场 /plugin marketplace add revfactory/harness # 安装插件 /plugin install harness@harness-marketplace -
配置技能目录(可选,用于本地访问参考文档):
cp -r skills/harness ~/.claude/skills/harness -
使用示例: 在 Claude Code 中输入自然语言指令,例如:
Build a harness for this projectDesign an agent team for deep research. I need agents for web search, academic sources, and cross-validation.Build a harness for full-stack website development. Handle design, frontend, backend, and QA in a pipeline.
-
生成结果: 插件将在项目目录下生成
.claude/agents/(Agent 定义)和.claude/skills/(技能文件),你可以通过这些文件进一步微调或直接开始协作式开发。
许可证
Apache 2.0
