技术博客arXiv cs.AI·2 小时前

Contract2Tool：自动推断工具契约提升大模型智能体可靠性

原标题：Contract2Tool: Learning Preconditions and Effects for Reliable Tool-Augmented LLM Agents

速览

针对工具增强型大模型智能体依赖外部API但缺乏因果适用性描述的痛点，研究团队提出Contract2Tool框架。该框架能从元数据、文档和执行轨迹中自动推断出包含前置条件、效果和风险等级的标准化工具契约。实验表明，该方法生成的契约在保持高可靠性的同时，大幅减少了可见工具数量和Token消耗，为工具生态提供了可扩展的契约层。

AI 深度解读

Contract2Tool：为可靠工具增强型 LLM 智能体学习前置条件与效应

背景

随着大语言模型（LLM）智能体在复杂任务中的广泛应用，它们越来越依赖于外部 API 和工具来执行具体操作。然而，现有的工具描述方式存在显著的局限性：标准的工具 Schema（模式）通常仅定义了“如何调用”一个工具（例如参数类型、必填字段），却未能阐明“何时”因果上适宜调用该工具，以及调用后会对任务状态产生何种具体影响。

这种信息缺失导致智能体在工具选择上缺乏因果推理能力，容易引发错误调用或低效执行。为了解决这一问题，“因果工具过滤”（Causal Tool Filtering, CMTF）应运而生。CMTF 通过引入轻量级的“契约”（Contracts）来规范工具的使用，这些契约明确指定了每个工具的前置条件（Preconditions）、效应（Effects）、风险等级（Risk Level）以及成本（Cost）。

尽管 CMTF 能显著提升智能体的可靠性，但其落地面临一个核心瓶颈：手动编写和维护这些契约无法扩展。面对庞大且不断变化的工具生态系统，人工维护契约不仅成本高昂，而且难以跟上工具更新的节奏。因此，亟需一种能够自动化从元数据、文档和执行痕迹中推断工具契约的方法。

核心内容

针对上述挑战，研究人员提出了 Contract2Tool 框架。这是一个旨在从多种来源自动推断工具契约的系统，其核心目标是构建一个可扩展的契约层，连接底层工具 Schema 与上层的可靠智能体执行。

1. 多源证据融合

Contract2Tool 不依赖单一数据源，而是综合以下四类证据来推断契约：

元数据（Metadata）：工具的基本属性信息。
Schema：工具的结构化定义。
文档（Documentation）：自然语言描述的工具使用说明。
执行痕迹（Execution Traces）：历史运行日志，记录工具实际调用时的输入输出及状态变化。

2. 符号化契约生成

框架将上述可观察的工具证据转化为标准化的符号契约（Normalized Symbolic Contracts）。这种符号化表示使得契约既可以在系统内部进行内在评估（Intrinsic Evaluation），也可以直接部署到下游的因果工具过滤模块中。

3. 评估体系与结果

研究团队对 Contract2Tool 生成的学习契约进行了全面评估：

内在准确性：将学习到的契约与人工标注的“黄金标准”（Gold Standards）前置条件、效应和风险标签进行对比。
下游效用：在多步智能体任务中测试这些契约对任务成功率和效率的影响。

实验结果显示，混合文档与执行痕迹证据生成的契约，其准确性足以保留黄金标准契约的大部分可靠性和效率优势。具体数据如下：

下游成功率：使用学习契约的 CMTF 达到 0.980 的成功率，接近使用黄金契约的 0.990。
工具可见性优化：将智能体可见的工具数量从 100 个大幅减少至 1 个，显著降低了搜索空间。
资源效率提升：相比暴露所有工具的场景，平均 Token 使用量从 26,172 降至 2,528，效率提升超过 10 倍。

关键要点

解决扩展性难题：Contract2Tool 解决了手动维护工具契约在大规模、动态工具生态中不可扩展的问题，实现了契约生成的自动化。
多模态证据融合：通过结合静态信息（文档、Schema）和动态信息（执行痕迹），Contract2Tool 能够生成比单一来源更准确、更全面的工具契约。
因果推理增强：生成的契约包含前置条件和效应，使智能体能够基于因果逻辑判断“何时”调用工具，而不仅仅是“如何”调用，从而减少无效或有害的工具调用。
显著的性能提升：
- 高可靠性：学习契约下的智能体成功率（0.980）与黄金契约（0.990）差距极小。
- 高能效：Token 消耗降低约 90%，大幅降低了推理成本。
- 高聚焦：通过过滤无关工具，将候选工具集从 100 个精简至 1 个，极大提升了决策速度和准确性。
标准化输出：将非结构化的证据转化为标准化的符号契约，便于系统集成和下游模块直接调用。

意义与影响

Contract2Tool 的提出标志着工具增强型 LLM 智能体向更可靠、更高效、更可扩展方向迈出了关键一步。

填补因果推理空白：传统工具调用仅关注语法正确性，而 Contract2Tool 引入了语义和因果层面的约束，使智能体具备类似“常识”的工具使用判断力，减少了幻觉和错误操作。
降低开发与维护成本：自动化契约生成机制使得企业可以轻松集成大量第三方 API 而无需投入大量人力进行文档化和规则编写，加速了智能体应用的落地。
优化资源利用：通过大幅减少 Token 使用和工具搜索空间，Contract2Tool 为大规模部署智能体提供了经济可行的解决方案，特别是在对延迟和成本敏感的场景中。
推动标准化进程：该框架提出的“标准化符号契约”概念，可能成为未来工具生态系统中的一种通用接口标准，促进不同工具和智能体之间的互操作性。

总之，Contract2Tool 不仅是一个技术框架，更是构建下一代可靠 AI 智能体的基础设施组件，它证明了通过自动化学习因果约束，可以显著提升 LLM 智能体在复杂现实世界任务中的表现。

查看原文 →arxiv.org