技术博客arXiv cs.AI·2 小时前

AdMem：融合语义情景程序记忆的LLM智能体框架

原标题：AdMem: Advanced Memory for Task-solving Agents

速览

针对大语言模型在长程任务中记忆与复用知识的局限，AdMem提出一种融合语义、情景和程序记忆的自动框架。该框架采用双层设计及多智能体架构，实现记忆的自动生成、奖励标注与自适应检索。通过基于奖励的长期记忆管理，确保系统可扩展并持续改进，实验证明其显著提升了长多轮任务的鲁棒性与成功率。

AI 深度解读

AdMem: 面向任务求解代理的高级记忆框架深度解读

背景

大型语言模型（LLMs）作为能够调用外部工具的代理（Agents），在解决复杂问题方面展现出巨大潜力。然而，在需要长时间跨度（long-horizon）的任务中，LLMs 的表现往往受到限制，这些任务要求代理具备记忆、组织以及复用知识的能力。

现有的记忆方法主要致力于解决上下文窗口有限的问题，但其重点大多集中在存储事实性信息（factual information）上。虽然近期关于程序性记忆（procedural memory）的研究改善了任务复用的能力，但这些方法通常简化为简单地回放过去的成功经验，未能有效处理失败案例，且在在线场景下的可扩展性（online scalability）不足。

为了突破这一瓶颈，研究人员提出了 AdMem，这是一个统一的、自动化的记忆框架，旨在通过整合语义记忆、情景记忆和程序性记忆，提升 LLM 代理在长期任务中的鲁棒性和成功率。

核心内容

AdMem 的核心创新在于其双层设计（bi-level design），结合了短期存储和长期存储，并构建了一个多代理架构来实现记忆的自动生成、奖励标注和自适应检索。

1. 统一的多模态记忆架构

AdMem 不再单一依赖某种记忆类型，而是将三种关键记忆形式整合在一起：

语义记忆（Semantic Memory）：存储通用知识和事实。
情景记忆（Episodic Memory）：记录具体的交互历史和情境。
程序性记忆（Procedural Memory）：存储解决特定任务的步骤和策略。

这种整合使得代理不仅能记住“是什么”，还能记住“怎么做”以及“在什么情况下做”。

2. 多代理协作机制

AdMem 采用了一个包含三个角色的多代理架构：

Actor（执行者）：负责执行具体任务。
Memory（记忆代理）：负责记忆的生成、存储和管理。
Critic（批评者）：负责评估任务执行结果，进行奖励标注。

这种分工使得记忆的管理不再是静态的，而是动态且自适应的。Critic 代理提供的反馈信号驱动了记忆系统的优化。

3. 长期记忆的自动化管理

AdMem 解决了长期记忆扩展性的关键难题，通过以下机制管理长期记忆库：

基于奖励的评估（Reward-based evaluation）：根据任务执行的结果对记忆片段进行评分。
合并（Merging）：将相似或相关的记忆片段整合，减少冗余。
剪枝（Pruning）：移除低价值或过时的记忆，确保记忆库的高效性。

这一过程确保了系统在不断学习和积累知识的同时，能够保持可扩展性并实现持续改进。

4. 自适应检索

结合短期和长期存储，AdMem 能够根据当前任务的需求，自适应地从记忆库中检索最相关的信息。这不仅包括过去的成功经验，也包括从失败中汲取的教训，从而提高了代理在复杂环境下的适应能力。

关键要点

统一框架：AdMem 是一个统一的自动化记忆框架，同时整合了语义、情景和程序性记忆，弥补了以往方法仅关注事实存储或简单回放成功的不足。
双层存储设计：采用短期存储与长期存储相结合的双层架构，平衡了即时响应需求与长期知识积累。
多代理协同：通过 Actor、Memory 和 Critic 三个代理的协作，实现了记忆的自动生成、基于奖励的标注以及自适应检索。
长期记忆优化：利用基于奖励的评估、合并和剪枝机制，有效管理长期记忆库，解决了可扩展性和持续改进的问题。
处理失败案例：与仅回放成功路径的方法不同，AdMem 能够利用失败案例进行学习和优化，提升了代理的鲁棒性。
实验验证：在多种环境下的实验表明，相较于现有的基线方法，AdMem 在长期多轮任务中表现出更高的鲁棒性和成功率。

意义与影响

AdMem 的研究强调了全面且自适应的记忆机制对于推动基于 LLM 的代理发展的重要性。

突破长程任务瓶颈：通过引入程序性记忆并有效处理失败案例，AdMem 为解决需要长时间规划和多步推理的复杂任务提供了新的解决方案。
从静态存储到动态进化：传统的记忆模块往往是静态的或仅做简单检索，而 AdMem 通过 Critic 代理和自动化管理流程，使记忆系统具备了“进化”能力，能够随着交互不断自我优化。
提升代理的实用性：通过解决可扩展性和在线学习能力，AdMem 使得 LLM 代理在实际应用场景中更加可靠和高效，特别是在需要长期交互和知识复用的领域（如自动化工作流、复杂游戏或模拟环境）。

这项工作为构建更智能、更具适应性的 AI 代理奠定了重要的技术基础，标志着从单纯依赖上下文窗口向构建结构化、可进化记忆系统的重要转变。

查看原文 →arxiv.org