The Past Is Prologue: A Plug-in Controller for Selective Updates in Sequentially Evolving LLM Memory
AI 深度解读
过去乃序章:面向顺序演进 LLM 记忆的选择性更新插件控制器
背景
随着 LLM 智能体在复杂、长周期的任务中运行,拥有能够跨会话复用过去经验的“记忆系统”已成为刚需。然而,现有的顺序演进记忆系统普遍存在一个盲区:它们通常在每次生成新的记忆更新时,都会无脑地将其部署到记忆中,而缺乏一个关键的校验环节——即判断这次更新是否真的能改善智能体未来的行为。
这种盲目更新的机制带来了严重的副作用:为了适应当前任务而生成的新记忆,可能会覆盖掉原本有用的通用知识;可能会引入过于具体、泛化能力差的规则;或者导致最终的记忆状态严重偏向最近的几个例子,从而破坏记忆的长期稳定性。如何让记忆在“持续学习”与“保持稳定”之间取得平衡,是当前 LLM 智能体记忆系统面临的核心痛点。
核心内容
针对上述问题,本文提出了 Janus——一个插件式的记忆控制器。Janus 的核心职责是充当记忆更新的“守门人”,在每次产生候选记忆更新时,决定是接受新记忆还是保留旧记忆。
为了实现高效且准确的决策, Janus 引入了两大核心机制:
- Memory Momentum Trigger(记忆动量触发器):Janus 不会盲目地对所有更新进行全量评估,而是首先通过该触发器来识别记忆更新轨迹中的“可疑偏差”。只有当更新轨迹出现异常波动或偏离正常轨道时,Janus 才会启动后续的深度评估,从而极大节省了计算开销。
- 紧凑混合评估集:在需要评估时,Janus 摒弃了回放完整历史记录的昂贵做法,转而使用一个紧凑的混合评估集。该评估集包含三类任务:覆盖任务、边界任务和新鲜任务。通过将旧记忆与新记忆在这三类任务上的表现进行对比,Janus 可以精准判断新记忆是带来了真正的进步,还是导致了过拟合或知识遗忘。
Janus 具有极强的通用性,它是一种“方法不可知”的插件。这意味着它可以直接包裹在现有的记忆更新器之外,无需修改或干涉更新器内部的更新规则,即可实现选择性更新的功能。
实验验证方面,研究
查看原文 →arxiv.org
