技术博客arXiv cs.AI·3 小时前

递归视角推理：让大模型具备心智理论能力

原标题：Mind the Perspective: Let's Reason Recursively for Theory of Mind

速览

针对大模型在心智理论推理中难以处理嵌套信念的难题，研究提出RecToM推理框架。该框架通过递归方式构建角色视角，将高阶信念问题转化为实际世界问题，并具备严谨的模态逻辑基础。实验显示，RecToM在多个基准测试中超越现有方法，在Hi-ToM上实现100%准确率。

AI 深度解读

Mind the Perspective: Let's Reason Recursively for Theory of Mind

背景

心智理论（Theory of Mind, ToM）是人工智能领域中的一个核心挑战，它要求智能体能够根据部分且不对称的观察结果，推断其他智能体的信念、意图和知识状态。对于大型语言模型（LLMs）而言，尽管它们在语言理解和生成方面表现出色，但在处理涉及多层级信念推理（即“我认为你知道我认为……”）的任务时，往往表现不佳。

现有的基于提示（Prompting）的方法主要通过过滤可观察事件或构建时间信念链来改善 ToM 推理能力。然而，这些方法通常缺乏对嵌套信念（Nested Beliefs）的显式建模。换句话说，它们难以准确捕捉角色之间复杂的认知层级关系，导致在解决高阶 ToM 问题时出现逻辑断裂或错误。

核心内容

为了解决上述问题，研究人员提出了一种名为 RecToM 的推理时框架（Inference-time framework）。该框架的核心思想是通过递归视角构建（Recursive Perspective Construction）来显式建模嵌套信念，从而提升 LLMs 的心智理论推理能力。

1. 递归视角构建机制

RecToM 不再试图一次性处理复杂的信念层级，而是沿着问题中指定的角色链条（Character Chain），从第一个角色的视角开始，逐步构建后续角色的视角。

逐层递进：每个角色的视角都是基于前一个角色的视角构建的。
降维打击：通过这种递归构建，高阶信念问题（例如“A 认为 B 认为 C 知道……”）被转化为最终构建出的视角内的实际世界问题。这意味着模型只需要在最后一个构建好的视角中进行推理，从而简化了计算复杂度并提高了准确性。

2. 形式化分析：KD45 逻辑

研究团队进一步提供了基于 KD45 模态逻辑的分析。KD45 是描述信念（Belief）的标准逻辑系统，包含一致性（Consistency）、正内省（Positive Introspection）和负内省（Negative Introspection）等公理。分析表明，RecToM 的视角构建过程诱导出了一个良构的信念模态（Well-formed belief modality），这超越了简单的基于事件过滤的方法，从理论上保证了推理结构的严谨性。

3. 实验结果

在多个主流 ToM 基准测试上，包括 Hi-ToM、Big-ToM 和 FanToM，RecToM 在多种 LLM 骨干网络（Backbones）上均表现出显著优势：

性能领先：RecToM 一致优于近期最先进的（State-of-the-art）方法。
突破性成绩：在要求高阶 ToM 推理的 Hi-ToM 基准测试中，结合 GPT-5.4 和 Qwen3.5 模型，RecToM 达到了 100% 的准确率。这一结果证明了该方法在处理复杂嵌套信念时的有效性和鲁棒性。

关键要点

痛点解决：现有 LLM 在处理 ToM 任务时，难以显式建模嵌套信念，导致高阶推理失败。
方法创新：提出 RecToM 框架，通过递归方式沿角色链条构建视角，将高阶信念问题转化为最终视角下的实际世界问题。
理论支撑：通过 KD45 模态逻辑分析，证明该方法构建了良构的信念模态，优于简单的过滤机制。
实证效果：在 Hi-ToM、Big-ToM、FanToM 等基准测试中，RecToM 性能 consistently 优于 SOTA 方法。
极致表现：在 Hi-ToM 测试中，配合 GPT-5.4 和 Qwen3.5 实现 100% 准确率，验证了其在高阶心智理论推理上的卓越能力。

意义与影响

RecToM 的提出标志着 LLMs 在认知推理能力上的重要一步。

从“统计关联”到“逻辑推理”：传统 LLM 往往依赖数据中的统计模式进行回答，而 RecToM 通过显式的递归结构，引入了类似逻辑推演的机制，使模型能够更准确地模拟人类的心智状态推断过程。
提升复杂场景下的可靠性：在需要多角色互动、信息不对称的场景（如法律辩论、医疗诊断协作、自动驾驶中的交通参与者预测）中，准确的心智理论推理至关重要。RecToM 的高准确率表明，这类方法可以显著降低模型在复杂交互中的幻觉和错误。
开源与社区价值：虽然原文未详细展开代码实现，但其在 arXiv 上的发布及相关的 alphaXiv、Hugging Face 等社区链接，暗示了该框架的可复现性和对开源社区的潜在贡献。未来，类似的递归推理框架可能被集成到更多主流 LLM 的推理管线中，推动通用人工智能（AGI）在社交智能和社会认知方面的进步。

总之，RecToM 不仅是一个性能提升工具，更是一种新的推理范式，它证明了通过结构化的视角递归构建，可以有效突破 LLMs 在心智理论推理上的瓶颈。

查看原文 →arxiv.org