← 返回信息流
技术博客arXiv cs.AI·7 小时前

多智能体交互记忆框架助力群体经验共享

原标题:Multi-Agent Transactive Memory

速览

该研究提出多智能体交互记忆(MATM)框架,旨在解决异构智能体群体中的知识共享问题。框架将智能体生成的轨迹存入共享仓库,供其他智能体检索复用,避免重复探索。实验表明,该方法在无需协调或联合训练的情况下,能显著提升任务性能并减少交互步骤。

AI 深度解读

Multi-Agent Transactive Memory:构建多智能体生态的经验共享基础设施

背景

随着大语言模型(LLM)智能体在多样化任务中的去中心化部署,如何促进异构智能体群体之间的知识共享,已成为一个亟待解决的基础设施问题。在人类社会中,搜索引擎通过索引人类生成的文档来支持问题解决;类比于此,检索系统也可以用于组织智能体生成的产物,以便在智能体群体中复用。

现有的检索增强生成(RAG)技术主要证明了人类 authored(创作)的产物对单个智能体的价值。然而,当我们将视角从单个智能体扩展到智能体群体时,需要一种机制来检索由智能体生成的产物,以支持整个群体的任务执行。

在当前的实践中,智能体的交互轨迹(agent trajectories)编码了可复用的程序性知识(procedural knowledge)。但通常情况下,这些轨迹在单次使用后就会被丢弃,或者仅由生产该轨迹的智能体保留。这导致新实例化的智能体不得不重复发现已有的解决方案,造成了巨大的计算资源浪费和学习效率低下。

核心内容

为了解决上述问题,研究人员提出了 Multi-Agent Transactive Memory (MATM),即“多智能体交互记忆”。这是一个用于智能体群体层面存储和检索智能体生成轨迹的框架。

1. 核心机制:生产者与消费者模式

MATM 框架建立了一个共享仓库(shared repository),其运作机制类似于人类团队中的“交互记忆系统”(Transactive Memory System):

  • 生产者智能体(Producer Agents):在执行任务过程中生成轨迹,并将这些轨迹贡献到共享仓库中。
  • 消费者智能体(Consumer Agents):在需要解决类似任务时,从共享仓库中检索相关轨迹,利用这些历史经验来改进自身的任务执行策略。

2. 应用场景:交互式环境

研究重点聚焦于具有长轨迹且编码丰富程序性结构的交互式环境,具体包括:

  • ALFWorld:一个基于文本的家居导航与操作模拟环境。
  • WebArena:一个用于评估智能体在真实网页界面上执行复杂任务能力的基准测试平台。

在这些环境中,智能体需要执行多步骤操作,轨迹中包含了大量的状态转换、工具调用和决策逻辑,具有极高的复用价值。

3. 实验结果

实验表明,通过检索 MATM 中的轨迹,可以显著带来以下收益:

  • 提升下游任务性能:智能体能够更准确地完成任务。
  • 减少交互步骤:智能体无需从头探索,而是借鉴已有经验,从而减少了与环境交互的次数。
  • 无需协调或联合训练:这种改进是在没有智能体间显式协调(coordination)或联合训练(joint training)的情况下实现的,证明了该框架作为一种即插即用的设计模式的可行性。

关键要点

  • 填补知识共享空白:MATM 将 RAG 从“人类知识辅助单个智能体”扩展到了“智能体知识辅助智能体群体”,解决了异构智能体间的知识孤岛问题。
  • 程序性知识的复用:不同于静态的事实性知识,MATM 特别关注可复用的“程序性知识”(即“如何做”的知识),通过存储和检索智能体轨迹来实现。
  • 去中心化与无协调:该框架不依赖中央控制器或智能体间的实时通信协调,也不需要进行复杂的联合训练,降低了部署复杂度。
  • 适用于长程任务:在 ALFWorld 和 WebArena 等需要多步推理和操作的复杂环境中,MATM 的效果尤为显著,因为长轨迹蕴含了更丰富的决策逻辑。
  • 设计模式定位:研究将 MATM 定位为开放智能体生态系统中“群体层面经验共享”的一种通用设计模式(design pattern)。

意义与影响

MATM 的提出为构建大规模、开放的多智能体生态系统提供了重要的基础设施思路。

  1. 提升系统效率:通过避免重复探索已知解决方案,显著降低了计算成本和响应时间。
  2. 加速新智能体冷启动:新加入的智能体可以通过检索历史轨迹快速获得“经验”,无需从零开始训练或探索,极大地缩短了学习曲线。
  3. 促进知识积累与进化:随着时间推移,共享仓库中的轨迹库会不断增长和丰富,使得整个智能体群体的能力能够随着历史经验的积累而持续进化。
  4. 推动标准化接口:MATM 提供了一种标准化的知识存储与检索范式,有助于不同厂商、不同架构的智能体在开放生态中实现互操作性和知识互通。

总之,Multi-Agent Transactive Memory 不仅是一个技术方案,更是迈向具备集体智慧、能够自我进化的多智能体社会的关键一步。

查看原文 →arxiv.org