技术博客arXiv cs.AI·2 小时前

专家保留与自主源推理分离：无原始心电重播的持续心电部署

原标题：Separating Expert Retention from Autonomous Source Inference in Raw-ECG-Replay-Free Continual ECG Deployment

速览

论文提出arXiv:2607.01674v1解决方案，聚焦多源心电部署问题。在无法保留或重播原始心电数据时，模型需无缝适应新数据源。方法构建于冻结的1024维ECGFounder特征上，每个新领域添加平衡softmax线性专家，同时仅在保留训练特征与领域标签上训练轻量路由器。通过验证校准边际规则融合两个最可能的专家，而非硬路由选择。实验在CPSC、PTB-XL、Georgia、Chapman-Shaoxing数据集上，源感知专家选择达0.7915±0.0036 Macro-F1；无源ID时MLP路由器达0.7756±0.0027，顶2边际融合达0.7782±0.0022。结果显示专家保留效果强劲，但自主源推理仍为主要瓶颈（顶2与Oracle差距0.0111-0.0133），为AI驱动的持续学习与多源医疗数据处理提供关键优化路径。

AI 深度解读

背景

在多源ECG部署场景中，模型需要根据新数据源不断适应，但早期采集的原始ECG波形无法长期保留或重放。这种约束导致参数更新必须避免干扰已学到的知识，同时仍能处理新来的数据源。当原始ECG数据源元数据（source metadata）不可用时，部署阶段仍需自主选择合适的专家模型。传统方法冻结预训练骨干网络（backbone），为每个数据源单独分配一个孤立的分类器，虽然可有效防止参数干扰，但仍依赖于源元数据来判断当前输入属于哪个专家。

我们通过提出的方法\ours{}（incremental expert bank）对这一区分进行了系统研究。该方法构建于冻结的1024维ECGFounder特征提取器上，针对每一到来数据源构建一个平衡softmax线性专家（balanced-softmax linear expert）。路由器（router）仅在保留的训练特征和已观察到源的标签上进行轻量级拟合。验证集校准的边际规则（margin rule）不再硬性选择单一路由专家，而是融合两个最可能的专家结果。

该研究聚焦于CPSC、PTB-XL、Georgia和Chapman-Shaoxing等数据集，量化了源感知专家选择与无源元数据下自主推理之间的差距，为连续ECG部署中权衡专家保留与自主源推理提供了实证基准。

核心内容

原始ECG部署中的多源连续适应面临两大核心挑战：一是保留历史原始ECG数据受限（无法重放），二是源元数据缺失导致部署时无法直接识别数据源。这使得单纯冻结预训练模型难以处理新数据，同时仍需保留专家知识以避免灾难性遗忘。

\ours{}方法通过以下步骤实现分离：首先，冻结一个1024维ECGFounder特征提取器作为共享骨干，将原始ECG转换为稳定特征表示。其次，为每个新数据源独立训练一个平衡softmax线性专家分类器，这些专家之间参数完全隔离，不发生干扰。第三，构建轻量级路由器：仅使用已观察到数据源的训练特征与对应标签进行拟合（而非所有数据），实现从特征到专家的映射。第四，部署时采用验证集校准的边际规则：计算每个专家的置信度，取前两个最可能的专家并通过边际规则融合其预测结果，而非单专家硬路由。

实验验证在CPSC、PTB-XL、Georgia和Chapman-Shaoxing四个多源ECG数据集上进行。源感知专家选择（使用源元数据）达到0.7915\pm0.0036的Macro-F1分数，与离线独立头参考模型（matched offline independent-head reference）的0.7885\pm0.0009高度匹配，表明专家保留机制有效。无源元数据时，MLP路由器单独实现0.7756\pm0.0027的Macro-F1，top-2边际融合进一步提升至0.7782\pm0.0022。top-2融合相对于MLP硬路由的增益仅为+0.0026，配对Bootstrap 95%置信区间包含零，统计上无显著差异。

跨三种数据源顺序测试中，top-2融合与oracle（源感知专家选择）之间的差距稳定在0.0111–0.0133之间，表明自主源推理仍是主要瓶颈。值得注意的是，方法未重放任何原始ECG，仅保留冻结训练特征用于路由器更新，因此属于非记忆自由（not memory-free）的方法。

关键要点

\ours{}通过冻结1024维ECGFounder特征提取器与每个数据源独立平衡softmax线性专家，实现专家保留与自主源推理的分离；
路由器仅拟合已观察源的训练特征与标签，部署时使用验证集校准边际规则融合top-2专家结果而非单专家路由；
源感知专家选择在四个数据集上达0.7915\pm0.0036 Macro-F1，与独立头参考模型0.7885\pm0.0009匹配，验证专家保留有效；
无源元数据下MLP路由器0.7756\pm0.0027，top-2融合0.7782\pm0.0022，增益+0.0026（Bootstrap 95% CI含零，无显著差异）；
跨三种数据源顺序，top-2-to-oracle差距0.0111–0.0133，自主源推理为主要剩余瓶颈；
方法未重放原始ECG，仅保留训练特征用于路由器更新，属于非记忆自由方法。

意义与影响

该研究为连续多源ECG部署提供了明确的权衡框架：通过专家银行与路由器分离，实现了在原始数据无法重放条件下的专家知识保留，同时量化了自主源推理的实际代价。实验结果表明，专家保留机制已接近最优（源感知与独立头模型差距仅0.003），而自主推理的瓶颈主要源于当前路由能力不足（top-2增益不显著且与oracle差距稳定）。这为后续工作指明了方向——在不重放原始ECG的情况下提升无元数据下的源推理准确性，同时保持模型轻量与连续更新能力。

在临床ECG应用场景中，尤其面对不同医院设备、患者群体或采集协议导致的数据源漂移时，该方法为实现真正“自主适应”的部署系统奠定了基础，避免了灾难性遗忘并支持长期维护。其非记忆自由特性在资源受限的边缘设备上具有显著优势，未来可结合更先进的路由或融合机制进一步缩小自主推理差距，推动多源连续ECG模型从实验室到临床部署的落地。

查看原文 →arxiv.org

专家保留与自主源推理分离：无原始心电重播的持续心电部署

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐