技术博客arXiv cs.CL·2 小时前

Metis：融合文本与代码记忆实现智能体自我进化

原标题：Metis: Bridging Text and Code Memory for Self-Evolving Agents

速览

现有自进化智能体通常在设计时固定使用文本或代码记忆，难以兼顾构建成本与执行效率。Metis提出分层双表示记忆机制，将文本经验转化为执行计划和环境事实，并将重复计划结晶为可调用工具。该设计在AppWorld基准测试中，使任务准确率最高提升20.6%，同时降低22.8%的执行成本，实现了准确性、效率与构建成本的最佳平衡。

AI 深度解读

Metis：通过桥接文本与代码记忆实现自进化智能体

背景

在人工智能领域，自进化智能体（Self-evolving Agents）的核心能力在于能够从过去的执行经验中提炼知识，并将其复用于未来的任务中，从而随时间推移不断提升性能。然而，当前系统在表示这些“经验”时，主要存在两种截然不同的范式：

自然语言文本（Text Memory）：将经验以自然语言的形式注入到智能体的上下文（Context）中。这种方式灵活、通用，但推理成本高，且难以直接执行。
代码工具（Code Memory）：将经验封装为可调用（Callable）的代码工具。这种方式执行效率高，但构建成本高，且缺乏灵活性。

现有的研究通常在设计阶段就固定选择其中一种表示方式，而忽略了经验本身的特性。这种“一刀切”的做法导致系统无法充分利用两种表示方式的互补优势，使得在构建成本、执行效率和可迁移性之间的权衡（Trade-offs）缺乏深入的理解。

核心内容

为了解决上述问题，研究人员提出了 Metis 系统，并首先进行了一项受控实验，旨在隔离并比较纯文本记忆与纯代码记忆在相同经验集上的表现。

1. 受控实验与发现

研究团队对相同的经验集分别采用文本和代码两种形式进行了对比测试。结果揭示了一个关键洞察：文本记忆和代码记忆在构建成本、执行效率和可迁移性方面表现出互补的权衡关系。

文本记忆：具有广泛的适用性，适合处理新颖或复杂的逻辑，但执行效率较低。
代码记忆：执行效率极高，但构建和维护成本高，且难以适应未预见的变化。

结论是，单一的记忆表示形式不足以应对所有场景，理想的系统应当结合两者的优势。

2. Metis 系统架构：分层双重表示记忆

基于上述发现，Metis 提出了一种基于**分层双重表示记忆（Hierarchical Dual-Representation Memory）**的自进化智能体系统。其核心机制如下：

文本经验的组织：Metis 将原始的经验文本结构化地组织为三类：
- 执行计划（Execution Plans）：完成任务的步骤序列。
- 环境事实（Environment Facts）：关于当前状态或外部世界的静态信息。
- 常见陷阱（Common Pitfalls）：过去失败或低效的经验总结，用于避免重蹈覆辙。
代码的结晶（Crystallization）：系统并非将所有经验都转化为代码，而是选择性地将重复出现的执行计划“结晶”为经过验证的可调用工具。
- 只有当某个计划被证明需要被重复使用，且其收益超过构建代码的成本时，系统才会将其转化为代码工具。
- 这种机制确保了工具生成成本仅在“重复复用” justified（合理/必要）时才产生。

这种设计巧妙地结合了文本记忆的广泛适用性和代码记忆的执行效率，实现了动态的资源分配。

3. 性能评估

研究在 AppWorld 这一具有挑战性的交互式智能体基准测试上对 Metis 进行了评估。实验结果如下：

准确率提升：与经典的 ReAct 框架相比，Metis 的任务准确率最高提升了 20.6%。
成本降低：在执行成本（包括计算资源和时间）方面，Metis 最高降低了 22.8%。
综合平衡：与现有的代表性自进化智能体系统相比，Metis 在准确率、执行效率和记忆构建成本之间实现了一致且更优的平衡。

关键要点

互补而非互斥：文本记忆和代码记忆并非非此即彼的关系，它们在构建成本、执行效率和可迁移性上存在显著的互补权衡。
动态转化机制：Metis 的核心创新在于“选择性结晶”。它不预设所有经验都需转化为代码，而是根据经验的复用频率和验证结果，动态决定何时将文本计划转化为代码工具。
结构化的文本记忆：文本经验不再是一团乱麻，而是被组织为执行计划、环境事实和常见陷阱，提高了大模型理解和利用文本信息的效率。
成本效益优化：通过仅在重复复用 justified 时才生成代码工具，Metis 避免了不必要的工具构建开销，从而在保持高准确率的同时显著降低了执行成本。
实证效果显著：在 AppWorld 基准测试中，Metis 相比 ReAct 实现了准确率提升 20.6% 和执行成本降低 22.8% 的双重收益。

意义与影响

Metis 的研究为自进化智能体的记忆机制设计提供了新的范式。它打破了传统上在“文本上下文”与“代码工具”之间二选一的局限，证明了**混合表示（Hybrid Representation）和动态演化（Dynamic Evolution）**是提升智能体性能的关键。

这一工作对以下领域具有深远影响：

智能体架构设计：未来的智能体系统不应仅关注单一的推理模式，而应构建能够根据任务需求动态切换或融合多种记忆表示的架构。
资源优化：通过量化文本与代码的权衡，Metis 为如何在有限的计算资源下最大化智能体性能提供了可操作的指导原则。
长期记忆管理：研究强调了“经验提炼”的重要性，即如何将非结构化的历史交互转化为结构化的、可复用的知识单元，这是实现智能体长期进化的基础。

总之，Metis 不仅是一个性能更优的系统，更是一个关于如何高效管理智能体“记忆”的理论框架，为构建更聪明、更经济、更具适应性的 AI 代理指明了方向。

查看原文 →arxiv.org