技术博客arXiv cs.AI·2 小时前

AI自动搜索联邦学习算法的创新工具

原标题：Auto-FL-Research: Agentic Search for Federated Learning Algorithms

速览

Auto-FL-Research是一款约束性多代理工作流工具，专为联邦学习算法研究设计。代理可以自主提出并实现优化器变体、服务器聚合规则、客户端更新计划等候选算法，通过任务配置文件固定搜索空间和评估标准。实验结果显示，该工具在五项医疗交叉切片FLamby任务和六项LEAF数据集上取得四项任务及五项数据集的性能提升，并能有效区分算法机制改进与搜索随机性影响。

AI 深度解读

背景

联邦学习（Federated Learning，FL）已成为分布式机器学习的重要范式，尤其在医疗健康等跨机构场景中具有实际价值。研究者通常需要对多个关键算法组件进行精心设计，包括优化器变体、服务器聚合规则、本地训练调度、归一化、规则化和模型架构等。这些选择对最终模型性能至关重要，但手动探索的成本极高，且候选方案的改动往往会同时影响联邦学习训练路径和评估流程，导致公平比较变得困难。为此，Auto-FL-Research（AFR）应运而生，旨在通过自动化方式系统性地搜索和优化联邦学习算法配方。

核心内容

Auto-FL-Research（AFR）是一个约束编码智能体工作流，专为联邦学习算法配方搜索而设计。该系统允许智能体提出并实现候选训练算法，这些算法包括服务器聚合规则、客户端更新调度、本地目标函数以及注册的模型变体。每个任务配置文件会固定可变表面（mutation surface），例如计算预算、通信合约以及最终模型评估标准。

整个搜索过程分为多个campaign，每个campaign会完整记录候选方案的评分、运行时间、已编辑文件、生成工件以及失败状态。这一设计确保了可重复性、可追溯性和全面评估。

实验评估基于五个医疗健康跨 silo FLamby 任务，以及分群客户端配置文件（covering five fixed LEAF 数据集和一个 LEAF 合成任务）。所有结果均通过五个种子重复评估进行验证。实验结果显示，AFR 在四个 FLamby 任务上取得显著提升，并在六个 LEAF 配置文件中的五个上获得改进效果。同时，研究者还识别出种子敏感性问题和搜索中筛选出的失败案例。

为进一步分析提升来源，研究者设计了同预算控制实验（same-budget controls）。这些实验表明：部分性能提升源于实际的联邦学习配方改动（FL-recipe changes），而其他改进则可通过固定表面上的标量控制（fixed-surface scalar controls）实现；此外，还有一些提升仅在单次运行或特定评估中出现，未能通过重复或留出测试（held-out evaluation）验证。这些混合结果正是该工作的核心贡献之一：它清晰展示了智能体生成候选方案如何被细分为“重复的联邦学习机制改进”“固定表面的调优效应”以及“选定的单次运行工件”。

关键要点

AFR 采用约束编码智能体工作流，智能体可自由提出并实现服务器聚合、客户端调度、本地目标及模型变体，同时任务配置文件严格限定可变空间、计算预算和评估标准。
每个campaign全程记录候选评分、运行时长、修改文件、工件及失败状态，确保透明度与可重复性。
实验覆盖五个医疗 FLamby 任务及 LEAF 数据集系列（含固定与合成任务），均通过五个种子重复评估。
结果显示 AFR 在四个 FLamby 任务和五个 LEAF 配置文件上取得提升，并揭示了种子敏感性与筛选失败案例。
同预算控制实验证实：部分提升源于真实 FL 机制改动，部分可被固定表面调优覆盖，另有部分为单次运行或评估工件，未经多轮验证。

意义与影响

Auto-FL-Research 标志着联邦学习算法优化的范式转变：从传统人工实验转向受约束的智能体驱动搜索。这一方法不仅显著降低了算法设计门槛，还为医疗健康等高敏感场景提供了可扩展的自动化研究管道。研究通过混合结果的深入分析，揭示了智能体搜索的局限性与潜力，提醒研究者需同时关注配方变化、表面调优和偶然效应，从而为后续联邦学习研究提供了方法论范例。随着更多任务和数据集的扩展，AFR有望成为联邦学习算法探索的标准化工具，推动AI在隐私保护和分布式场景中的实际应用。

查看原文 →arxiv.org

AI自动搜索联邦学习算法的创新工具

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐