← 返回信息流
GitHub 热榜GitHub Trending · 日·7 天前

Harness:自动化构建领域专用智能体团队与技能的元技能框架

原标题:revfactory/harness
HTML3,709 stars+68 今日

速览

Harness 是一个元技能框架,能够自动设计针对特定领域的智能体团队,定义专业化智能体角色,并生成它们所需的执行技能。它适用于需要快速搭建定制化多智能体工作流、降低 Agent 开发门槛的场景。

AI 深度解读

这是什么

Harness 是 GitHub 上由 revfactory 维护的热门开源项目(主语言 HTML,Star 数 3709+),它是 Claude Code 生态系统中位于 L3 Meta-Factory(元工厂层) 的“团队架构工厂”。

简单来说,Harness 是一个插件,能够根据你对项目领域的自然语言描述(支持英语、韩语、日语),自动生成适配的 Agent 团队架构 和对应的 Skills(技能定义)。它不直接执行代码任务,而是负责“设计”如何组织多个 specialized agents(专用智能体)来协作完成复杂任务。

在 Claude Code 的生态分层中,Harness 处于生成其他 Harness 的元层级,具体定位为 Team-Architecture Factory(团队架构工厂)。它与同属 L3 层的 Archon(负责生成确定性运行时配置)互补,分别解决“谁来协作”和“如何运行”的问题。

解决的问题

LLM 代码代理(Code Agents)在处理单一、简单任务时表现良好,但在面对复杂、多步骤、需要多角色协作的工程任务时,往往缺乏结构化的协作机制,导致输出质量不稳定、上下文混乱或逻辑断裂。

Harness 旨在解决以下核心痛点:

  1. 复杂任务拆解困难:用户难以手动设计高效的 Agent 协作拓扑(如流水线、主从结构、专家池等)。
  2. 上下文管理低效:多 Agent 交互时,如何高效传递数据、处理错误和协调流程缺乏标准化模板。
  3. 领域适配成本高:为特定领域(如全栈开发、深度研究、漫画制作)定制 Agent 团队需要深厚的 Prompt Engineering 和架构设计知识。
  4. 输出质量方差大:缺乏结构化预配置(Structured Pre-Configuration)时,LLM 输出的质量和一致性随任务复杂度增加而显著下降。

核心功能

Harness 通过一个 6 阶段工作流,将自然语言需求转化为可执行的 Agent 团队配置:

  1. Domain Analysis(领域分析):解析用户的项目描述,确定任务边界和领域特性。
  2. Team Architecture Design(团队架构设计):从 6 种预定义的架构模式中选择合适的模式(见下文)。
  3. Agent Definition Generation(Agent 定义生成):自动生成 .claude/agents/ 目录下的 Agent 定义文件(如 analyst.md, builder.md)。
  4. Skill Generation(技能生成):自动生成 .claude/skills/ 目录下的技能文件,采用 Progressive Disclosure(渐进式披露) 技术以优化上下文窗口使用。
  5. Integration & Orchestration(集成与编排):配置 Agent 间的数据传递、错误处理协议和团队协调机制。
  6. Validation & Testing(验证与测试):提供触发验证、Dry-run 测试以及“有技能 vs 无技能”的对比测试方法。

支持的 6 种团队架构模式

  • Pipeline(流水线):线性任务流,前一步输出作为后一步输入。
  • Fan-out/Fan-in(扇出/扇入):并行处理多个子任务,最后汇总结果。
  • Expert Pool(专家池):多个专家并行工作,由主 Agent 选择最佳方案。
  • Producer-Reviewer(生产者-审核者):生成内容并即时进行质量审核的循环。
  • Supervisor(监督者):中央监督 Agent 分配任务并监控进度。
  • Hierarchical Delegation(层级委派):多层级的任务委派结构。

亮点 / 与同类相比

1. 明确的生态定位:L3 元工厂层

Harness 不只是一个 Prompt 集合,而是 Claude Code 生态中的基础设施层。它位于 L3 层,专门负责团队架构的生成。

  • 与 Archon 的区别Archon 是 Runtime-Configuration Factory,负责生成确定性的运行时配置;Harness 是 Team-Architecture Factory,负责生成 Agent 团队结构和协作协议。两者是邻居子层,可结合使用(用 Harness 设计架构,用 Archon 部署运行时)。
  • revfactory/harness-100 的关系:后者是前者的产物库,提供了 100 个生产就绪的 Agent 团队 Harness,覆盖 10 个领域,共 200 个包。

2. 实证驱动的质量提升

根据作者进行的 A/B 测试(revfactory/claude-code-harness,n=15),使用 Harness 进行结构化预配置后:

  • 平均质量提升 +60%(从 49.5 分提升至 79.3 分)。
  • 胜率 15/15(在所有 15 个测试任务中均优于对照组)。
  • 方差降低 -32%,表明输出更加稳定。
  • 注:效果随任务复杂度增加而放大(Basic +23.8%, Advanced +29.6%, Expert +36.2%)。

3. 渐进式技能生成(Progressive Disclosure)

自动生成的 Skills 采用渐进式披露策略,仅在需要时加载详细信息,有效管理 LLM 的上下文窗口,避免信息过载。

4. 多语言支持与跨运行时潜力

  • 支持英语、韩语、日语触发指令。
  • 虽然当前官方运行时仅限 Claude Code,但已有社区端口如 SaehwanPark/meta-harness 针对 Codex 进行了移植,展示了跨运行时协作的路线图。

适合谁用 / 上手

适合人群

  • Claude Code 高级用户:希望自动化复杂工程任务的 Agent 编排,而非手动编写每个 Agent 的 Prompt。
  • AI 应用架构师:需要快速原型化不同 Agent 协作模式(如监督者、流水线)以评估最佳实践。
  • 特定领域开发者:如全栈开发、深度研究、内容创作(YouTube/Webtoon)、代码审查等,需要结构化团队分工的场景。

快速上手指南

  1. 前置条件

    • 安装 Claude Code。
    • 启用实验性 Agent 团队功能:设置环境变量 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
  2. 安装插件

    # 添加插件市场
    /plugin marketplace add revfactory/harness
    # 安装插件
    /plugin install harness@harness-marketplace
    
  3. 配置技能目录(可选,用于本地访问参考文档):

    cp -r skills/harness ~/.claude/skills/harness
    
  4. 使用示例: 在 Claude Code 中输入自然语言指令,例如:

    • Build a harness for this project
    • Design an agent team for deep research. I need agents for web search, academic sources, and cross-validation.
    • Build a harness for full-stack website development. Handle design, frontend, backend, and QA in a pipeline.
  5. 生成结果: 插件将在项目目录下生成 .claude/agents/(Agent 定义)和 .claude/skills/(技能文件),你可以通过这些文件进一步微调或直接开始协作式开发。

许可证

Apache 2.0

查看原文 →github.com