技术博客arXiv cs.AI·1 小时前

基于边干预的有向无环图特征归因方法DAG-SHAP

原标题：Feature Attribution in Directed Acyclic Graphs Using Edge Intervention

速览

针对现有基于Shapley值的特征归因方法在处理复杂特征交互和因果关系时的不足，研究提出DAG-SHAP方法。该方法基于边干预，将每个特征边作为独立的归因对象，有效捕捉特征的外部性和外生影响。实验验证了该方法在真实和合成数据集上的有效性。

AI 深度解读

基于边干预的有向无环图特征归因方法解读

背景

在机器学习模型的可解释性研究中，特征归因（Feature Attribution）旨在量化各个输入特征对模型预测结果的贡献程度。目前，基于 Shapley 值（Shapley Value）的方法因其严谨的博弈论基础，成为了该领域的黄金标准。然而，当数据中存在复杂的特征交互以及潜在的因果关系时，传统的 Shapley 值方法面临严峻挑战。

现有的大多数方法通常采用“以节点为中心”（node-centric）的视角，即将重要性仅仅分配给单个特征节点。这种视角的局限性在于，它往往无法同时捕捉特征的“外部性”（externality，即一个特征对其他特征或模型输出的间接影响）和“外生影响”（exogenous influence，即特征自身的直接贡献）。即使提供了因果结构信息，这种单一的节点归因方式也容易导致不合理的解释结果，难以真实反映特征在复杂因果网络中的作用机制。

核心内容

针对上述局限性，本文提出了一种名为 DAG-SHAP 的新型特征归因方法。该方法的核心创新在于从“节点干预”转向“边干预”（Edge Intervention），并基于有向无环图（Directed Acyclic Graphs, DAGs）的结构特性进行设计。

1. 从节点到边的范式转变

DAG-SHAP 不再将单个特征视为唯一的归因对象，而是将“特征边”（feature edge）视为独立的归因单元。在有向无环图中，边代表了特征之间的因果依赖或信息流动路径。通过干预特定的边，DAG-SHAP 能够更精细地分解特征的影响：

捕捉外部性：通过阻断或保留特定路径，评估一个特征通过其他特征间接影响模型输出的程度。
捕捉外生影响：区分特征自身直接产生的贡献与其通过因果链传递的贡献。

2. 算法原理与计算

DAG-SHAP 基于 Shapley 值的公理化定义，但将其应用范围扩展到了图的边结构上。它通过模拟对图中边的干预（例如，切断某条边以模拟因果关系的缺失），来计算每条边对最终预测值的边际贡献。这种方法确保了在存在复杂交互和因果结构的情况下，归因结果既符合因果逻辑，又具备数学上的合理性。

3. 高效近似算法

由于在大规模图中计算精确的 Shapley 值计算复杂度极高，本文还引入了一种近似方法，用于高效地计算 DAG-SHAP。该近似方法在保持归因准确性的同时，显著降低了计算开销，使得该方法能够应用于实际的大规模数据集。

4. 实验验证

作者在真实数据集和合成数据集上进行了广泛的实验。实验结果表明，DAG-SHAP 能够有效捕捉特征的外部性和外生贡献，其归因结果比传统基于节点的方法更加合理且符合因果直觉。代码已开源，供社区验证和使用。

关键要点

痛点识别：传统基于 Shapley 值的节点中心归因方法，在处理具有复杂因果结构和特征交互的数据时，无法同时准确捕捉特征的外部性和外生影响，导致解释偏差。
核心创新：提出 DAG-SHAP 方法，将归因对象从“特征节点”转变为“特征边”，基于边干预（Edge Intervention）机制进行重要性分配。
理论优势：该方法能够同时量化特征的直接贡献（外生影响）和通过因果路径产生的间接贡献（外部性），从而提供更符合因果逻辑的解释。
技术实现：引入了高效的近似算法，解决了在 DAG 结构上计算边级 Shapley 值的计算复杂度问题。
实证效果：在真实和合成数据集上的实验验证了 DAG-SHAP 的有效性，其归因结果优于现有主流方法。

意义与影响

DAG-SHAP 的提出为可解释人工智能（XAI）领域，特别是在因果机器学习（Causal ML）方向，提供了一个重要的理论工具和技术路径。

提升解释的因果一致性：在医疗、金融等对因果逻辑要求极高的领域，仅仅知道“哪个特征重要”是不够的，还需要知道“特征是如何影响结果的”。DAG-SHAP 通过边干预机制，使得归因结果与潜在的因果结构保持一致，增强了模型决策的可信度。
解决复杂交互下的归因难题：对于高维、强耦合的特征系统，传统方法往往产生混淆或误导性的归因。DAG-SHAP 通过解耦直接和间接影响，为理解复杂系统中的特征贡献提供了更清晰的视角。
推动因果归因标准化：该方法为基于因果图的特征归因提供了一套标准化的计算框架，有助于后续研究在统一的基准上进行比较和改进。

总体而言，DAG-SHAP 不仅是一种新的算法，更是一种对特征重要性本质的更深入理解，它强调了在存在因果结构时，归因分析应当超越静态的节点重要性，转而关注动态的信息流动和因果路径。

查看原文 →arxiv.org