技术博客arXiv cs.AI·4 小时前

心智理论效用：形式化心智化机制

原标题：The Theory of Mind Utility: Formal Specification of a Mentalizing Mechanism

速览

ToM-U在计算层面形式化了推断他人信念的认知机制，通过构建局部认知世界模型（LEWMs）来评估离散候选模型。该框架定义了LEWM结构、代理节点属性及递归心智化的增殖机制，并提供了三种推理程序。与传统贝叶斯心智理论不同，ToM-U不预设信念状态，而是从模型结构属性出发生成可证伪的心智化失败预测。

AI 深度解读

心智理论效用（ToM-U）：心智化机制的形式化规范

背景

在人工智能与社会认知科学的交叉领域，如何准确推断他人的信念、意图和知识状态（即“心智化”，Mentalizing）是一个核心难题。传统的“心智理论”（Theory of Mind, ToM）研究通常依赖于两种主要范式：一是“模拟理论”（Simulation Theory），即通过模拟他人的心理状态来理解他人；二是“理论-理论”（Theory-Theory），即像科学家一样使用内隐的社会心理学理论来解释他人行为。

然而，现有的形式化模型存在显著局限。例如，贝叶斯心智理论（Bayesian Theory of Mind）及其相邻的形式化解释往往预设了信念状态的存在，而非从更基础的证据中推导出来。此外，这些传统方法缺乏处理“认识论状态”（epistemic state）推断的严密形式化工具，特别是在处理信息来源、信息顺序以及可信度等复杂信号时显得力不从心。

本文提出的 Theory of Mind Utility (ToM-U) 旨在从计算分析层面解决这一问题。它不承诺具体的算法或神经实现，而是专注于定义心智化计算什么以及为什么计算，从而为理解人类及智能体如何构建对他人的认知模型提供一个严谨的数学框架。

核心内容

ToM-U 的核心在于构建 局部认识论世界模型（Local Epistemic World Models, LEWMs）。这是一种有向类型图（directed typed graphs），用于表示智能体、状态节点以及它们之间的认识论关系。ToM-U 通过评估离散的候选 LEWMs 与观察到的行为是否匹配，直到获得足够的置信度，从而完成对他人信念状态的推断。

文章通过五个正式定义详细规范了 LEWM 的结构和功能：

LEWM 结构定义：明确了模型的基本拓扑结构，包括智能体节点、状态节点以及连接它们的边，这些边代表了认识论关系（如“知道”、“相信”等）。
智能体节点属性：特别强调了有序的信息访问历史（ordered information access history）。这意味着模型不仅记录智能体知道了什么，还记录了这些信息是以何种顺序、由谁提供的。这是区分不同信念来源的关键。
递归心智化的有界增殖机制：为了解决无限递归带来的计算爆炸问题（例如，“我认为你认为我知道...”），ToM-U 引入了一种有界的增殖机制，限制心智化层级的深度，确保计算的可操作性。
三种推断程序：文章定义了三种具体的推断过程，用于在观察到的行为数据与候选 LEWM 之间进行匹配和评分。
残差函数（Residue Function）：这是一个创新的概念，用于捕获心智化尝试失败后留下的结构化痕迹。如果模型无法完美解释观察到的行为，残差函数会记录这种不匹配的模式，这可能揭示了智能体认知的局限性或信息的缺失。

ToM-U 与现有理论的关键区别在于其推导方式。贝叶斯心智理论通常假设信念状态是已知的或先验给定的，而 ToM-U 则是从观察到的行为信号中推导出信念状态。它关注的是“谁告诉了他什么”、“按什么顺序”以及“有多可信”这些表面信号背后的认识论结构。

关键要点

计算层面的抽象：ToM-U 在计算分析层面进行形式化，独立于具体的算法实现或神经生物学基础，使其具有更广泛的适用性。
LEWMs 作为核心载体：使用有向类型图（Local Epistemic World Models）来建模智能体及其认识论关系，能够精确捕捉信息来源和顺序的影响。
有序信息访问：模型显式地跟踪智能体获取信息的顺序，这对于区分相似但来源不同的信念至关重要。
有界递归：通过引入有界增殖机制，解决了深层递归心智化带来的计算复杂性问题，使模型在理论上和实践中都更具可行性。
残差函数的价值：不仅关注成功的心智化，还通过残差函数量化和分析心智化失败的模式，为理解认知偏差或信息不足提供了新的视角。
区别于贝叶斯方法：ToM-U 不预设信念状态，而是从行为证据中推导信念，避免了贝叶斯模型中常见的先验假设问题。
领域无关性：该架构被定位为一种领域无关（domain-agnostic）的机制，位于目标推断（goal inference）和其他下游社会认知过程的上游，意味着它可以作为更复杂社会认知任务的基础组件。

意义与影响

ToM-U 的提出对社会认知建模和人工智能领域具有深远意义。

首先，它提供了一个可证伪的预测框架。由于 ToM-U 基于模型的结构属性而非辅助假设，它能够生成关于心智化失败的方向性预测。这使得研究人员可以通过实验验证模型在特定情境下的表现，从而推动理论的科学化进程。

其次，ToM-U 填补了形式化工具的空白。在“模拟理论”和“理论-理论”缺乏严密数学基础的情况下，ToM-U 为认识论状态推断提供了一套完整的形式化 apparatus。这不仅有助于理解人类心智化的本质，也为构建具备真正社会智能的 AI 系统提供了理论蓝图。

最后，作为上游机制，ToM-U 为更高级的社会认知任务奠定了基础。通过准确推断他人的信念和知识状态，AI 系统可以更有效地进行目标推断、协作规划和社会互动。这种从基础认识论状态到高级社会行为的层级化建模，是迈向通用人工智能（AGI）中社会智能的关键一步。

总之，ToM-U 不仅是对传统心智理论的形式化升级，更是连接计算理论与社会认知科学的一座桥梁，为理解智能体如何“理解”彼此提供了新的计算范式。

查看原文 →arxiv.org