GitHub 热榜GitHub Trending · 日·7 天前

Harness：自动化构建领域专用智能体团队与技能的元技能框架

原标题：revfactory/harness

HTML★ 3,709 stars+68 今日

速览

Harness 是一个元技能框架，能够自动设计针对特定领域的智能体团队，定义专业化智能体角色，并生成它们所需的执行技能。它适用于需要快速搭建定制化多智能体工作流、降低 Agent 开发门槛的场景。

AI 深度解读

这是什么

Harness 是 GitHub 上由 revfactory 维护的热门开源项目（主语言 HTML，Star 数 3709+），它是 Claude Code 生态系统中位于 L3 Meta-Factory（元工厂层） 的“团队架构工厂”。

简单来说，Harness 是一个插件，能够根据你对项目领域的自然语言描述（支持英语、韩语、日语），自动生成适配的 Agent 团队架构 和对应的 Skills（技能定义）。它不直接执行代码任务，而是负责“设计”如何组织多个 specialized agents（专用智能体）来协作完成复杂任务。

在 Claude Code 的生态分层中，Harness 处于生成其他 Harness 的元层级，具体定位为 Team-Architecture Factory（团队架构工厂）。它与同属 L3 层的 Archon（负责生成确定性运行时配置）互补，分别解决“谁来协作”和“如何运行”的问题。

解决的问题

LLM 代码代理（Code Agents）在处理单一、简单任务时表现良好，但在面对复杂、多步骤、需要多角色协作的工程任务时，往往缺乏结构化的协作机制，导致输出质量不稳定、上下文混乱或逻辑断裂。

Harness 旨在解决以下核心痛点：

复杂任务拆解困难：用户难以手动设计高效的 Agent 协作拓扑（如流水线、主从结构、专家池等）。
上下文管理低效：多 Agent 交互时，如何高效传递数据、处理错误和协调流程缺乏标准化模板。
领域适配成本高：为特定领域（如全栈开发、深度研究、漫画制作）定制 Agent 团队需要深厚的 Prompt Engineering 和架构设计知识。
输出质量方差大：缺乏结构化预配置（Structured Pre-Configuration）时，LLM 输出的质量和一致性随任务复杂度增加而显著下降。

核心功能

Harness 通过一个 6 阶段工作流，将自然语言需求转化为可执行的 Agent 团队配置：

Domain Analysis（领域分析）：解析用户的项目描述，确定任务边界和领域特性。
Team Architecture Design（团队架构设计）：从 6 种预定义的架构模式中选择合适的模式（见下文）。
Agent Definition Generation（Agent 定义生成）：自动生成 .claude/agents/ 目录下的 Agent 定义文件（如 analyst.md, builder.md）。
Skill Generation（技能生成）：自动生成 .claude/skills/ 目录下的技能文件，采用 Progressive Disclosure（渐进式披露） 技术以优化上下文窗口使用。
Integration & Orchestration（集成与编排）：配置 Agent 间的数据传递、错误处理协议和团队协调机制。
Validation & Testing（验证与测试）：提供触发验证、Dry-run 测试以及“有技能 vs 无技能”的对比测试方法。

支持的 6 种团队架构模式

Pipeline（流水线）：线性任务流，前一步输出作为后一步输入。
Fan-out/Fan-in（扇出/扇入）：并行处理多个子任务，最后汇总结果。
Expert Pool（专家池）：多个专家并行工作，由主 Agent 选择最佳方案。
Producer-Reviewer（生产者-审核者）：生成内容并即时进行质量审核的循环。
Supervisor（监督者）：中央监督 Agent 分配任务并监控进度。
Hierarchical Delegation（层级委派）：多层级的任务委派结构。

亮点 / 与同类相比

1. 明确的生态定位：L3 元工厂层

Harness 不只是一个 Prompt 集合，而是 Claude Code 生态中的基础设施层。它位于 L3 层，专门负责团队架构的生成。

与 Archon 的区别：Archon 是 Runtime-Configuration Factory，负责生成确定性的运行时配置；Harness 是 Team-Architecture Factory，负责生成 Agent 团队结构和协作协议。两者是邻居子层，可结合使用（用 Harness 设计架构，用 Archon 部署运行时）。
与 revfactory/harness-100 的关系：后者是前者的产物库，提供了 100 个生产就绪的 Agent 团队 Harness，覆盖 10 个领域，共 200 个包。

2. 实证驱动的质量提升

根据作者进行的 A/B 测试（revfactory/claude-code-harness，n=15），使用 Harness 进行结构化预配置后：

平均质量提升 +60%（从 49.5 分提升至 79.3 分）。
胜率 15/15（在所有 15 个测试任务中均优于对照组）。
方差降低 -32%，表明输出更加稳定。
注：效果随任务复杂度增加而放大（Basic +23.8%, Advanced +29.6%, Expert +36.2%）。

3. 渐进式技能生成（Progressive Disclosure）

自动生成的 Skills 采用渐进式披露策略，仅在需要时加载详细信息，有效管理 LLM 的上下文窗口，避免信息过载。

4. 多语言支持与跨运行时潜力

支持英语、韩语、日语触发指令。
虽然当前官方运行时仅限 Claude Code，但已有社区端口如 SaehwanPark/meta-harness 针对 Codex 进行了移植，展示了跨运行时协作的路线图。

适合谁用 / 上手

适合人群

Claude Code 高级用户：希望自动化复杂工程任务的 Agent 编排，而非手动编写每个 Agent 的 Prompt。
AI 应用架构师：需要快速原型化不同 Agent 协作模式（如监督者、流水线）以评估最佳实践。
特定领域开发者：如全栈开发、深度研究、内容创作（YouTube/Webtoon）、代码审查等，需要结构化团队分工的场景。

快速上手指南

前置条件：
- 安装 Claude Code。
- 启用实验性 Agent 团队功能：设置环境变量 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1。

安装插件：

# 添加插件市场
/plugin marketplace add revfactory/harness
# 安装插件
/plugin install harness@harness-marketplace

配置技能目录（可选，用于本地访问参考文档）：
```
cp -r skills/harness ~/.claude/skills/harness
```
使用示例：在 Claude Code 中输入自然语言指令，例如：
- Build a harness for this project
- Design an agent team for deep research. I need agents for web search, academic sources, and cross-validation.
- Build a harness for full-stack website development. Handle design, frontend, backend, and QA in a pipeline.
生成结果：插件将在项目目录下生成 .claude/agents/（Agent 定义）和 .claude/skills/（技能文件），你可以通过这些文件进一步微调或直接开始协作式开发。

许可证

Apache 2.0

查看原文 →github.com