技术博客arXiv cs.CL·3 天前

SAGE：为智能体LLM提供高效记忆演进的 novelty 门控机制

原标题：SAGE: A Novelty Gate for Efficient Memory Evolution in Agentic LLMs

速览

SAGE是一种球形自适应门控机制，用于解决智能体大语言模型中记忆演进的写入控制问题。它基于von Mises-Fisher密度估计器对候选事实进行新颖性评分，将明确新颖的事实添加、冗余事实忽略，仅将不确定案例送入LLM合并步骤。实验表明，该方法在LoCoMo和GPT-4o-mini等基准上显著降低了添加阶段的API成本和延迟，同时保持了高质量的记忆效果。

AI 深度解读

SAGE：智能体大模型中高效记忆演化的新颖性门控机制

背景

随着基于大语言模型（LLM）的智能体（Agentic LLMs）在复杂任务中的广泛应用，长期记忆管理成为制约其性能的关键瓶颈。智能体需要在运行过程中持续从交互中提取新事实，并决定这些新信息是应该被添加、与现有记忆合并，还是被忽略。

然而，现有的研究工作大多集中在记忆的检索（Retrieval）和存储（Storage）优化上，对于“写入侧”（Write-side）的控制缺乏系统性的原则。这种缺失导致智能体在面对海量新信息时，往往无法高效地筛选冗余或重复内容，从而造成记忆库的膨胀、检索噪声增加以及高昂的计算成本。

为了解决这一痛点，研究人员将记忆演化问题重新框架化为一个“新颖性检测”（Novelty Detection）问题，并提出了 SAGE（Spherical Adaptive Gate for memory Evolution，用于记忆演化的球形自适应门控）。SAGE 旨在通过一种基于几何密度的高效机制，在写入阶段对候选事实进行智能路由，从而在保持记忆质量的同时显著提升系统效率。

核心内容

SAGE 的核心思想是利用向量空间的几何特性来判断新事实与现有记忆库之间的关系。它不再依赖昂贵的 LLM 推理来进行每一次记忆更新决策，而是采用了一种基于密度的估计方法。

1. 基于 von Mises-Fisher 分布的密度估计

SAGE 首先将记忆库中的嵌入向量（Memory Embeddings）视为高维球面上的点分布。它使用基于 von Mises-Fisher 分布的密度估计器来评估候选新事实（Candidate Facts）在现有记忆空间中的位置。

如果新事实位于高密度区域，说明它与现有记忆高度相似或冗余。
如果新事实位于低密度或边缘区域，说明它具有新颖性。

2. 自适应阈值路由机制

SAGE 设计了一个自适应阈值（Adaptive Threshold），该阈值会动态追踪记忆库的几何结构变化。根据密度估计的结果，SAGE 将候选事实分为三类并进行不同处理：

ADD（添加）：对于明确新颖的事实，直接将其添加到记忆库中。
NOOP（无操作）：对于明确冗余的事实，直接忽略，不进行任何写入操作。
LLM Merge（大模型合并）：仅将那些处于“不确定”区域（即密度适中，既不完全新颖也不完全冗余）的少数案例发送给 LLM 进行复杂的合并推理。

3. 效率与质量的平衡

通过这种分层处理机制，SAGE 极大地减少了需要调用 LLM 进行昂贵推理的次数。它作为一个即插即用的二进制门控（Binary Gate），可以嵌入到现有的记忆框架（如 A-Mem）中，无需修改底层模型架构。

关键要点

新颖性驱动的记忆演化：SAGE 将记忆更新问题转化为新颖性检测问题，通过密度估计而非纯语义匹配来区分新旧信息。
三层路由策略：
- 明确新颖 -> 直接添加（ADD）。
- 明确冗余 -> 直接忽略（NOOP）。
- 不确定/模糊 -> 交由 LLM 进行合并推理。
显著的成本降低：在 GPT-4o-mini 模型上测试显示，SAGE 将添加阶段的 API 成本降低了 3.4 倍，延迟降低了 2.5 倍，且仅带来微小的平均裁判评分（Judge-score）差距。
即插即用的兼容性：作为 A-Mem 的即插即用组件，SAGE 在五种不同模型上测试时，跳过了约 16-18% 的 LLM 调用，而在开放权重骨干模型（Open-weight backbones）上对记忆质量的影响微乎其微。
性能优势：在 LoCoMo 基准测试中，SAGE 在所有七种开放权重骨干模型的对比中，均取得了优于 Mem0 的平均 Token-F1 分数。

意义与影响

SAGE 的提出标志着智能体记忆管理从“被动存储”向“主动演化”的重要转变。其意义主要体现在以下几个方面：

解决写入侧的“噪声”问题：以往的研究多关注如何更好地检索记忆，而 SAGE 证明了在写入端进行 principled（有原则的）控制同样重要。通过过滤冗余信息，可以保持记忆库的紧凑性和高信噪比。
提升长期智能体的经济性：对于需要长期运行的智能体应用，记忆库会随时间无限增长。SAGE 通过减少不必要的 LLM 调用和存储写入，显著降低了系统的运行成本和延迟，使得长期记忆在商业应用中更具可行性。
几何视角的创新应用：将高维向量空间的几何密度（von Mises-Fisher 分布）应用于记忆新颖性判断，为 NLP 领域的记忆管理提供了新的技术路径。这种方法比传统的余弦相似度匹配更能捕捉数据分布的整体结构。
通用性与可扩展性：SAGE 被设计为一种通用的门控机制，不依赖于特定的 LLM 架构。这意味着它可以广泛应用于各种基于 RAG（检索增强生成）或长期记忆的智能体系统中，为构建更高效、更智能的 AI 代理提供了基础组件。

总之，SAGE 证明了“新颖性感知”的写入控制是提升长期智能体记忆质量和系统效率的一个实用且强大的杠杆。

查看原文 →arxiv.org