技术博客arXiv cs.CL·3 小时前

REVERIEMEM：基于视角受限记忆的角色扮演智能体

原标题：Staying In Character: Perspective-Bounded Memory For Book-Based Role-Playing Agents

速览

针对大型语言模型在书籍角色扮演中面临的事实越界和风格单调问题，研究提出REVERIEMEM三层记忆架构。该架构包含情景、语义和人格层，通过视角受限记忆确保角色行为符合原著设定。实验显示，该方法在知识边界保真度上提升34.6个百分点，叙事生成胜率约79%。

近年来，随着大型语言模型（LLM）在角色扮演（Role-Playing）领域的广泛应用，构建基于小说的角色代理成为研究热点。现有的系统通常通过从小说中提取角色、场景和关系来构建这些角色代理。然而，在处理长篇叙事时，这类系统面临着两个主要的失败模式：

事实越界（Factual Overreach）：由于共享检索机制或参数化记忆的存在，角色往往会使用超出其自身视角的事实。例如，一个角色可能“知道”其他角色不知道的秘密，或者拥有作者全知视角的信息，这破坏了角色的沉浸感和真实性。
风格单调（Stylistic Monotony）：传统的角色配置文件描述往往将角色扁平化为一种固定的声音或语调，导致角色在不同情境下缺乏动态变化的语言风格和行为模式。

为了解决上述问题，研究人员提出了一种新的记忆架构，旨在让角色严格限制在其视角范围内，并保持符合情境的性格特征。

针对上述挑战，研究团队提出了 REVERIEMEM，这是一种专为基于书籍的角色代理设计的三层记忆架构。该架构的核心在于“视角受限记忆”（Perspective-Bounded Memory），确保角色仅在其认知范围内获取信息并表现出相应的性格特征。

情景层（Episodic Layer）：该层存储第一人称的场景记忆。它模拟角色亲身经历的事件，确保角色只记得自己亲眼所见、亲耳所闻的内容，从而避免全知视角的泄露。
语义层（Semantic Layer）：该层存储带有“可见性标签”（visibility-tagged）的事实。每个事实都标记了哪些角色可以知晓。在检索信息时，系统会根据当前角色的视角过滤掉其无法知晓的信息，从而防止事实越界。
人格层（Personality Layer）：该层存储依赖于情境的言语和行为模式。它不仅仅是一个静态的角色标签，而是动态地根据当前场景和交互对象调整角色的说话方式和行为反应，从而解决风格单调的问题。

为了严格测试角色知识的边界，研究团队构建了 KBF-QA 基准测试。该基准包含来自八部小说的 4,386 个问题，专门用于评估角色代理在知识边界上的忠实度（Knowledge Boundary Fidelity）。

知识边界忠实度：与最强的先前方法相比，REVERIEMEM 在知识边界忠实度上提升了 34.6 个百分点。这表明该架构能显著减少角色使用超出其视角的事实的情况。
叙事生成质量：在 BOOKWORLD 的五维成对叙事协议测试中，REVERIEMEM 取得了约 79% 的胜率。这一结果证实，视角受限记忆不仅提高了知识边界的忠实度，还改善了基于角色特征的叙事生成质量。

解决两大痛点：现有基于 LLM 的角色扮演系统主要存在“事实越界”（角色知道不该知道的）和“风格单调”（角色说话千篇一律）两个问题。
三层记忆架构：REVERIEMEM 通过情景层（第一人称记忆）、语义层（带可见性标签的事实）和人格层（情境依赖的行为模式）三层结构，实现了对角色视角的严格限制。
视角受限：核心创新在于“视角受限记忆”，即角色只能访问其视角范围内可见的信息，模拟真实人类认知的局限性。
动态性格表现：人格层并非静态描述，而是存储情境依赖的言语和行为模式，使角色表现更加生动和多变。
显著的量化提升：
- 在 KBF-QA 基准上，知识边界忠实度提升 34.6%。
- 在 BOOKWORLD 叙事协议中，胜率达到 ~79%。
新基准发布：发布了 KBF-QA 基准（4,386 个问题，八部小说），为评估角色代理的知识边界提供了标准化的测试工具。

REVERIEMEM 的提出标志着基于文本的角色扮演代理研究从“信息提取”向“认知模拟”的重要转变。

提升沉浸感与真实性：通过强制角色遵守视角限制，REVERIEMEM 消除了“上帝视角”带来的出戏感，使角色互动更加符合人类社会的认知逻辑，极大地提升了沉浸式体验。
推动叙事 AI 的发展：该研究不仅关注角色的静态属性，还关注其在动态叙事中的表现。79% 的胜率表明，结合视角限制和动态性格模型，可以生成更高质量、更具连贯性的叙事内容。
为复杂角色模拟提供新范式：三层记忆架构为处理长文本、多角色互动的复杂场景提供了可行的技术路径。这对于开发更高级的交互式小说、游戏 NPC 以及个性化 AI 伴侣具有重要参考价值。
标准化评估的重要性：KBF-QA 基准的建立填补了该领域在“知识边界”评估上的空白，为后续研究提供了可复现、可比较的衡量标准，有助于推动整个领域的规范化发展。

总之，REVERIEMEM 通过模拟人类认知的局限性和情境依赖性，为解决角色扮演中的核心难题提供了有效的解决方案，为未来更智能、更真实的 AI 角色代理奠定了基础。