← 返回信息流
技术博客arXiv cs.AI·1 小时前

FedEPD:基于能量引导双解耦的联邦长尾图学习新框架

原标题:Towards Federated Long-Tailed Graph Learning: An Energy-Guided Dual Decoupling Approach

速览

针对联邦图学习中数据长尾分布导致的性能下降问题,研究提出FedEPD框架。该框架采用双解耦范式,利用分布感知狄利克雷能量剪滤除异质边,并通过空间低通原型注入克服非独立同分布偏移。实验表明,该方法在多个长尾基准测试中达到最先进水平,准确率提升最高达4.97%。

AI 深度解读

Towards Federated Long-Tailed Graph Learning: An Energy-Guided Dual Decoupling Approach 深度解读

背景

联邦图学习(Federated Graph Learning)旨在在保护数据隐私的前提下,促进分布式客户端之间的协作图建模。然而,现实世界中的数据类别往往呈现出严重的长尾分布(Long-Tailed Distribution)。这种统计上的稀缺性对模型性能造成了双重打击:

  1. 全局模型偏差:模型倾向于多数类(Majority Classes),导致对少数类(Minority Classes)的识别能力下降。
  2. 结构隔离:少数类节点被淹没在异质性高、由头部类别主导的邻居区域中,导致其在图结构上被孤立。

现有的方法通常尝试进行拓扑无关的统计补偿,但在数据稀缺的情况下往往失效。这些方法未能有效恢复尾部节点,反而过度拟合了来自相邻主导类别的结构噪声,导致表示(Representation)退化。

核心内容

为了解决上述局限性,研究人员提出了 FedEPD,这是一个基于“双重解耦”范式(Dual Decoupling Paradigm)的框架。该范式的核心思想是将拓扑净化(Topological Purification)与语义重校准(Semantic Recalibration)分离开来。

FedEPD 的具体工作流程包含以下三个关键步骤:

1. 基于分布感知的狄利克雷能量剪枝

首先,FedEPD 利用分布感知的狄利克雷能量(Dirichlet Energy)剪枝技术,过滤掉空间上的异质性边(Spatial Heterophilic Edges)。通过这种方式,模型能够识别并移除那些连接不同类别、可能引入噪声的边,从而净化图的拓扑结构,减少少数类节点受到的干扰。

2. 空间低通原型注入

为了克服非独立同分布(Non-IID)带来的分布偏移,FedEPD 从拓扑中心节点中提取鲁棒的全局原型(Global Prototypes)。这些原型代表了各类别的核心语义特征。随后,通过空间低通原型注入(Spatial Low-Pass Prototype Injection)机制,将这些全局原型整合到局部表示中。这一过程有助于在局部节点表示中注入全局一致的语义信息,增强模型的泛化能力。

3. 两阶段交替优化策略

最后,FedEPD 采用两阶段交替优化策略。该策略严格保护多数类的决策边界,同时专门针对少数类的准确性进行优化。通过这种平衡机制,模型在保持整体性能稳定的同时,显著提升了对长尾分布中尾部类别的识别精度。

关键要点

  • 双重解耦范式:FedEPD 的核心创新在于将拓扑结构的净化与语义特征的校准解耦,分别处理图结构噪声和类别不平衡问题。
  • 狄利克雷能量剪枝:利用狄利克雷能量作为指标,有效过滤异质性边,解决少数类节点被淹没在异质邻居中的结构隔离问题。
  • 全局原型注入:从拓扑中心节点提取全局原型,并通过低通滤波机制注入局部表示,以缓解 Non-IID 数据分布带来的偏移。
  • 平衡优化策略:通过两阶段交替优化,在保护多数类决策边界完整性的前提下,重点提升少数类的分类准确率。
  • 性能提升显著:在多个长尾基准测试中,FedEPD 达到了最先进(State-of-the-Art)的性能水平。具体而言,在准确率(Accuracy)上实现了高达 4.97% 的绝对提升,在宏平均 F1 分数(Macro-F1)上实现了高达 5.48% 的绝对提升。

意义与影响

FedEPD 的提出为联邦学习环境下的长尾图学习问题提供了新的解决思路。传统方法往往忽视了图结构中的异质性噪声对少数类节点的负面影响,而 FedEPD 通过拓扑净化和语义重校准的双重手段,有效地解决了这一痛点。

该框架不仅在理论上证明了将拓扑结构与语义信息分离处理的可行性,还在实证研究中展示了其在处理真实世界长尾分布数据时的优越性。这对于需要保护数据隐私且面临数据分布不均挑战的应用场景(如金融欺诈检测、医疗诊断、社交网络分析等)具有重要的实际应用价值。FedEPD 的性能提升表明,通过精细化的拓扑处理和原型注入,可以在不牺牲隐私的前提下,显著改善对稀缺类别的建模能力。

查看原文 →arxiv.org