技术博客arXiv cs.AI·14 小时前

Infini Memory：基于主题文档的LLM长期记忆维护架构

原标题：Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory

速览

针对现有LLM记忆系统难以聚合证据和更新事实的问题，研究提出Infini Memory架构。该架构将记忆视为主题结构化文档，通过缓冲区和定期整合实现事实修订。在MemoryAgentBench基准测试中，该方法取得了64.7%的综合得分，验证了其在长期记忆维护中的有效性。

AI 深度解读

Infini Memory：面向长期 LLM Agent 的可维护主题文档记忆架构

背景

随着大型语言模型（LLM）在自主智能体（Agent）领域的应用日益深入，长期记忆能力成为了制约其性能的关键瓶颈。一个具备长期记忆的 LLM Agent 不仅需要持久地存储信息，还需要能够追踪不断变化的事实，并在不同的会话（sessions）之间提供相关的证据支持。

然而，现有的记忆系统往往存在明显的局限性。大多数系统倾向于将观察到的信息存储为孤立的记录、摘要或索引片段。这种碎片化的存储方式导致了严重的维护难题：

证据聚合困难：难以将分散在不同时间点的证据有效地组合在一起。
事实修订复杂：当新信息推翻旧事实时，更新孤立记录的成本高昂且容易出错。
记忆维护低效：缺乏结构化的管理机制，导致记忆库随着时间推移变得臃肿且混乱。

为了解决这些问题，研究人员提出了 Infini Memory，一种基于文本的、可维护的持久记忆架构。该架构的核心创新在于将 Agent 的记忆视为“主题结构化文档”（topic-structured documents），从而实现对长期记忆的更精细管理和更高效利用。

核心内容

Infini Memory 提出了一种全新的记忆组织范式，其核心思想是将 Agent 的记忆从“数据记录”转变为“主题文档”。以下是该架构的主要工作机制：

1. 主题结构化文档作为语义单元

在 Infini Memory 中，每个“主题文档”（Topic Document）被视为一个独立的语义单元。这些文档不仅用于收集相关的证据，还负责保存元数据（metadata）并随时间推移对事实进行修订。这种结构使得记忆不再是杂乱无章的数据堆砌，而是具有明确语义边界和逻辑关联的知识块。

2. 缓冲与定期整合机制

为了保持记忆的连贯性和准确性，Infini Memory 引入了一个两阶段的处理流程：

缓冲阶段（Staging）：新的观察结果首先被存入缓冲区（buffer），而不是立即写入主记忆库。
整合阶段（Consolidation）：系统定期将缓冲区中的新观察结果整合进相应的主题文档中，形成连贯的文本上下文。这一过程确保了记忆内容的更新是平滑且经过深思熟虑的，避免了即时写入可能带来的噪声和冲突。

3. 迭代式工具调用检索

在推理（inference）阶段，Infini Memory 采用了一种独特的检索策略。与传统的单次检索步骤不同，该架构允许 LLM 通过迭代式的工具调用（iterative tool calls）来“阅读”记忆。这意味着 Agent 可以像人类查阅资料一样，逐步深入、反复验证记忆中的证据，从而获得更准确、更全面的上下文信息。

4. 实验验证

在 MemoryAgentBench 基准测试中，Infini Memory 取得了 64.7% 的整体得分。消融实验（Ablations）进一步证实了该架构的有效性：

主题结构化维护：显著提升了长期记忆的组织性和可检索性。
迭代式证据检查：增强了 Agent 对复杂事实的推理能力和准确性。这两者互补，共同改善了长期记忆使用的整体效果。

关键要点

范式转变：从存储孤立记录/片段转向存储“主题结构化文档”，使记忆具备更强的语义连贯性。
动态维护：通过“缓冲+定期整合”机制，实现了新证据的有序入库和旧事实的平滑修订，解决了记忆碎片化和过时问题。
迭代检索：摒弃单次检索，采用迭代式工具调用让 LLM 逐步深入阅读记忆，提高了证据聚合和事实核查的精度。
性能提升：在 MemoryAgentBench 上达到 64.7% 的得分，证明了主题结构化维护和迭代证据检查在长期记忆任务中的互补优势。
持久性与灵活性：该架构旨在解决现有系统在证据聚合、事实修订和记忆维护方面的痛点，为构建真正具备长期记忆能力的 LLM Agent 提供了可行的技术路径。

意义与影响

Infini Memory 的提出标志着 LLM Agent 记忆架构从“存储导向”向“维护导向”的重要转变。其意义主要体现在以下几个方面：

解决长期记忆的“熵增”问题：现有的记忆系统往往随着时间推移而变得混乱，Infini Memory 通过主题文档和定期整合机制，有效地控制了记忆库的熵增，保持了知识的有序性和时效性。
提升 Agent 的推理可靠性：迭代式检索机制允许 Agent 在回答问题前进行多轮证据验证，这大大减少了幻觉（hallucination）的发生，提高了 Agent 在复杂任务中的可靠性。
为通用智能体奠定基础：具备可维护、可修订的长期记忆是通用智能体（General Agent）的关键特征之一。Infini Memory 提供了一种可扩展的架构，使得 Agent 能够在长期交互中积累知识、修正错误，从而更接近人类的认知模式。
推动记忆系统的标准化研究：该工作为长期记忆系统的设计提供了新的基准和评估维度，鼓励后续研究关注记忆的结构化、可维护性和检索效率，而不仅仅是存储容量。

总之，Infini Memory 不仅是一个技术改进，更是对 LLM Agent 如何与时间、变化和复杂信息共处的深刻思考。它为构建更智能、更可靠、更具适应性的长期记忆 Agent 奠定了坚实的基础。

查看原文 →arxiv.org