技术博客arXiv cs.AI·4 小时前

HarnessBridge: 可学习双向控制器优化LLM智能体交互

原标题：HarnessBridge: Learnable Bidirectional Controller for LLM Agent Harness

速览

大型语言模型作为智能体执行长周期任务时，传统人工设计的交互接口难以扩展。HarnessBridge提出一种轻量级可学习控制器，通过双向投影机制将原始轨迹蒸馏为决策状态，并将动作转化为可执行转换。该方法在Terminal-Bench和SWE-bench上表现优异，显著减少Token使用和轨迹长度，并能从小模型泛化至大型商业模型。

AI 深度解读

HarnessBridge: 面向 LLM Agent 的可学习双向控制器深度解读

背景

随着大语言模型（LLM）在长周期任务（long-horizon tasks）中作为智能体（Agent）部署的场景日益增多，其最终表现不再仅仅取决于模型本身的推理能力或环境设计的优劣，还深受“Harness”（此处指代连接智能体与环境的中间层/接口机制）的影响。

传统的 Harness 设计主要依赖人工工程（manually engineered）。这种静态、硬编码的方式在面对日益增长的轨迹长度（trajectories）和愈发复杂的交互逻辑时，显得难以扩展且效率低下。现有的研究多聚焦于优化模型本身或环境反馈机制，却忽视了作为“中介”的 Harness 本身的智能化潜力。

本文提出一个核心问题：Harness 是否可以作为一个可学习的插件模块，通过端到端（end-to-end）的方式进行训练和生成？ 基于此，研究团队引入了 HarnessBridge，旨在解决传统人工设计 Harness 的扩展性瓶颈。

核心内容

HarnessBridge 是一个轻量级的可学习 Harness 控制器，其核心思想是将智能体与环境之间的接口参数化为一种**双向投影（bidirectional projection）**机制。该模块通过统一指令微调（unified instruction tuning）在 Harness 监督数据集上进行训练，主要包含两个关键的双向投影过程：

观察投影（Observation Projection）：该过程负责将原始、高维的轨迹数据蒸馏（distill）为紧凑的、与决策高度相关的状态表示。通过这种方式，智能体无需处理冗余的环境噪音，而是聚焦于对当前决策至关重要的信息片段。
动作投影（Action Projection）：该过程负责将智能体提出的动作建议转换为可执行的环境转换（executable transitions），或者基于轨迹上下文进行拒绝（trajectory-grounded rejections）。这意味着 Harness 不仅传递动作，还具备根据历史轨迹判断动作可行性的能力，从而防止无效或错误动作的执行。

在实验验证方面，研究者在 Terminal-Bench 2.0 和 SWE-bench Verified 这两个基准测试上对 HarnessBridge 进行了评估。结果显示，HarnessBridge 的表现匹配甚至超越了强大的专用（specialized）Harness 方案。更重要的是，它在显著减少 Token 消耗和缩短轨迹长度的同时，展现出了良好的泛化能力——即从小型生成器训练出的模型，能够有效地迁移并服务于更大的商业模型。

关键要点

范式转变：从“人工工程设计的静态 Harness”转向“可学习的动态插件模块”，实现了 Harness 的端到端训练。
双向投影架构：
- 输入侧：通过观察投影，将原始轨迹压缩为紧凑的状态表示，提升信息密度。
- 输出侧：通过动作投影，将建议动作转化为可执行操作或基于轨迹的拒绝信号，增强交互的鲁棒性。
训练方法：采用统一指令微调（unified instruction tuning）在专门的 Harness 监督数据集上进行优化。
性能优势：
- 在 Terminal-Bench 2.0 和 SWE-bench Verified 上，性能持平或优于强专用 Harness。
- 资源效率：大幅降低了 Token 使用量和轨迹长度，提升了运行效率。
泛化能力：证明了该轻量级控制器具有良好的跨模型泛化性，从小模型训练后可直接应用于大型商业 LLM。

意义与影响

HarnessBridge 的提出为 LLM Agent 的基础设施层带来了新的思考维度。以往的研究往往将 Agent 视为一个黑盒，专注于提升其内部推理能力，而忽略了其与外部环境交互的“接口”优化。

解耦与模块化：通过将 Harness 设计为可学习的插件，实现了智能体核心逻辑与环境交互逻辑的解耦。这使得开发者可以独立优化交互接口，而无需重新训练庞大的基础模型。
效率与成本的平衡：在长周期任务中，Token 消耗和轨迹长度是主要的成本和延迟瓶颈。HarnessBridge 通过蒸馏状态和过滤无效动作，从源头上减少了不必要的计算和资源浪费，这对于大规模部署 Agent 具有显著的经济价值。
可扩展性：传统人工设计的 Harness 难以应对复杂多变的场景，而可学习的控制器能够自适应地调整交互策略，为构建更复杂、更长期的自主智能体系统提供了可行的技术路径。

总之，HarnessBridge 不仅是一个性能优化工具，更是一种新的 Agent 架构设计思路，强调了“交互接口”在智能体系统中的核心地位。

查看原文 →arxiv.org