技术博客arXiv cs.AI·11 小时前

主动推断属于何种推理类型？

原标题：What Type of Inference is Active Inference?

速览

该研究将决策过程重构为推理问题，利用预期自由能统一目标导向与信息寻求行为。通过引入认知先验，证明增强模型的变分自由能可重写为预测模型变分自由能加显式熵修正项。实验表明，规划修正在决定性观测下有效，而认知修正在暗示性观测中更为关键。

AI 深度解读

主动推理（Active Inference）究竟属于哪种推理？——深度解读 arXiv:2606.xxxxx

背景

在人工智能与认知科学的交叉领域，主动推理（Active Inference） 是一种极具影响力的理论框架。它由 Karl Friston 等人提出，核心思想是将“决策”重新定义为“推理”。传统观点认为，智能体通过感知世界并据此采取行动来达成目标；而在主动推理框架下，智能体通过最小化“自由能（Free Energy）”来更新其对世界的信念，并选择那些能最小化预期自由能的动作。

其中，预期自由能（Expected Free Energy, EFE） 是主动推理中的关键概念，它统一了目标导向行为（goal-directed behavior）和信息寻求行为（information-seeking behavior）。简而言之，智能体不仅希望达成既定目标，还希望减少不确定性（即获取信息）。

然而，尽管 EFE 在理论上被广泛使用，其具体的数学结构、计算方式以及它与更基础的变分自由能（Variational Free Energy, VFE）之间的关系，在近期研究中仍存在需要厘清的地方。本文旨在从数学推导的角度，深入剖析 EFE 最小化过程的本质，揭示其背后的变分结构，并明确不同修正项在规划中的作用。

核心内容

本文主要探讨了主动推理中 EFE 最小化的数学本质，特别是如何将 EFE 最小化转化为对生成模型（generative model）的变分自由能（VFE）最小化问题。

1. 从 EFE 到增广模型的 VFE

近期研究表明，EFE 的最小化可以表述为在一个增广生成模型（augmented generative model）上最小化 VFE。这个增广模型引入了认识论先验（epistemic priors），用于鼓励智能体探索不确定性高的状态。

2. VFE 的分解与熵修正项

本文的核心贡献在于证明：增广模型的 VFE 可以重写为预测模型（predictive model）的 VFE 加上显式的熵修正项（explicit entropy-correction terms）。

这一分解使得 EFE 对整体推理过程的贡献变得透明。具体来说：

预测模型的 VFE：代表了智能体对当前世界状态的标准贝叶斯推断。
熵修正项：代表了为了获取信息（减少不确定性）而引入的额外项。

3. 规划修正与策略优化

仅仅依靠认识论修正（epistemic corrections）是不够的。本文指出，基于 EFE 的适当规划需要将上述认识论修正与一个规划修正（planning correction） 相结合。

规划修正的作用：它将边缘推断（marginal inference）转化为策略优化（policy optimization）。
结果：这种结合产生了对基于 EFE 的规划的完整变分表征（full variational characterization）。

这一发现澄清了在进行交叉熵规划（cross-entropy planning） 和完整基于 EFE 的规划时，究竟需要哪些具体的修正项。

4. 消息传递方案与实验验证

基于上述熵修正公式，本文提出了一种详细的消息传递方案（message-passing scheme），用于实现基于 EFE 的规划，同时也提供了更简单的消融实验（ablations）版本。

在三个网格世界（grid-world）环境中的实验结果显示：

决定性观测（decisive observations）：当观测结果能够明确指示状态时，仅使用规划修正就已经能显著提升性能。
暗示性观测（suggestive observations）：当观测结果仅提供模糊线索时，额外的观测侧认识论修正（observation-side epistemic corrections） 变得至关重要。

关键要点

理论统一：主动推理将决策视为推理过程，EFE 统一了目标导向和信息寻求行为。
数学分解：增广模型的 VFE = 预测模型的 VFE + 显式熵修正项。这一分解揭示了 EFE 中信息获取部分的数学本质。
双重修正必要性：完整的基于 EFE 的规划需要两种修正：
1. 认识论修正：用于处理信息寻求（减少不确定性）。
2. 规划修正：用于将边缘推断转化为策略优化，确保动作选择的有效性。
场景依赖性：
- 在观测信息明确（决定性）的场景下，规划修正起主要作用。
- 在观测信息模糊（暗示性）的场景下，认识论修正（熵修正）更为关键。
算法实现：提出了基于熵修正的消息传递算法，为高效实现基于 EFE 的规划提供了具体路径。

意义与影响

本文的理论工作对主动推理在人工智能中的应用具有深远意义：

澄清理论迷雾：通过严格的数学推导，明确了 EFE 最小化与 VFE 最小化之间的关系，消除了以往研究中关于“如何正确实现 EFE 最小化”的模糊性。
指导算法设计：指出了“规划修正”和“认识论修正”的不同作用，为设计更高效的强化学习或贝叶斯规划算法提供了理论依据。特别是在处理部分可观测马尔可夫决策过程（POMDPs）时，理解何时需要引入熵修正至关重要。
提升智能体性能：实验结果表明，正确应用这些修正项可以显著提升智能体在复杂、不确定环境中的规划能力。这对于开发更鲁棒、更具适应性的自主智能体（如机器人、自动驾驶系统）具有重要价值。
连接感知与行动：通过统一的变分框架，进一步弥合了感知（推断）与行动（规划）之间的鸿沟，为构建更接近生物智能的通用人工智能（AGI）架构提供了新的视角。

总之，这篇文章不仅深化了我们对主动推理理论的理解，也为实际应用中如何高效实现基于 EFE 的规划提供了清晰的路线图和实证支持。

查看原文 →arxiv.org