技术博客arXiv cs.AI·1 天前

Traj-Evolve：用于肺癌早期检测的自进化多智能体系统

原标题：Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection

速览

针对纵向电子病历数据稀疏且噪声大的挑战，研究提出Traj-Evolve自进化多智能体系统。该系统结合非参数记忆的经验池与多智能体强化学习，模拟临床医生利用既往相似病例经验进行推理的过程。在肺癌预测任务中，该系统在整体人群及难预测的不吸烟者群体中均优于9个强基线模型，验证了其在医疗AI领域的有效性。

AI 深度解读

Traj-Evolve：基于自进化多智能体系统的肺癌早期检测患者轨迹建模

背景

在医疗人工智能领域，利用纵向电子健康记录（EHRs）对患者疾病轨迹进行建模是一项极具挑战性的任务。这一过程需要处理稀疏、嘈杂且具有长上下文的多模态序列数据。现有的基于大型语言模型（LLM）的多智能体系统虽然解决了上下文长度的限制问题，但存在一个显著的局限性：它们通常将每位患者视为孤立个体进行处理。

这种孤立处理的方式未能模拟临床医生的实际工作逻辑。在现实诊疗中，医生往往会借鉴过往类似病例的积累经验和推理过程来辅助当前患者的诊断。现有的多智能体架构缺乏这种“经验复用”机制，导致其在复杂医疗场景下的推理能力和泛化能力受限。

核心内容

为了解决上述问题，研究人员提出了 Traj-Evolve，这是一个用于肺癌早期检测的自进化多智能体系统。该系统引入了两种互补的进化机制，旨在通过模拟临床医生的经验积累过程来提升预测性能。

1. 经验池（Experience Pool, ExPool）：非参数化记忆

ExPool 充当系统的非参数化记忆模块。其核心功能是通过拒绝采样（rejection-sampling）收集推理轨迹，并对这些轨迹进行索引。当系统处理新病例时，ExPool 能够检索出与当前患者相似的既往病例，作为少样本（few-shot）上下文提供给智能体。这种方式使得模型能够直接利用历史案例中的推理逻辑，而不仅仅是静态的数据特征。

2. 多智能体强化学习（MARL）：参数化优化

为了进一步优化智能体之间的协作以及智能体与记忆模块（ExPool）的交互，系统采用了基于奖励排名微调（Reward-Ranked Fine-Tuning, RFT）的多智能体强化学习（MARL）策略。这是一种参数化的优化手段，旨在提升多智能体系统在复杂决策任务中的协同效率。

3. 统一训练与推理：留一法交叉检索

为了弥合训练阶段与推理阶段的行为差异，研究提出了一种“留一法交叉检索”（leave-one-out cross-retrieval）策略。该策略统一了检索增强（retrieval augmentation）下的训练和推理行为，确保模型在应用检索增强技术时，其内部机制在两个阶段保持一致，从而提升系统的稳定性和可靠性。

4. 实验验证

在利用长达五年的多模态 EHRs 进行的肺癌预测任务中，Traj-Evolve 在整体人群以及极具挑战性的“从不吸烟者”（never-smoker）人群中，均优于 9 个强基线模型。

关键要点

双机制互补进化：Traj-Evolve 结合了非参数化的经验池（ExPool）和参数化的多智能体强化学习（MARL）。ExPool 负责提供类似的历史案例作为上下文，而 MARL 负责优化智能体间的协作逻辑。
模拟临床思维：通过检索相似患者的推理轨迹，系统打破了传统多智能体孤立处理患者的局限，更贴近医生“以案类比”的临床决策模式。
训练与推理的一致性：通过留一法交叉检索策略，解决了检索增强技术在训练和推理阶段可能出现的分布不一致问题，提升了模型的鲁棒性。
性能优势显著：在肺癌早期检测任务中，Traj-Evolve 不仅在整体人群中表现优异，在特征稀疏、风险因素不典型的“从不吸烟者”亚群中也取得了超越现有最强基线模型的效果。
进化动态的三大发现：
1. ExPool 规模效应：随着 ExPool 规模的扩大，最优检索策略从寻找“多样化”样本转向寻找“特定”样本，表明大样本量下精准匹配比广泛覆盖更重要。
2. 角色分工明确：在 MARL 优化下，负责整体预测的“管理者智能体”（manager agent）损失函数收敛迅速，而负责时间序列推理的“工作者智能体”（worker agents）则随着验证患者的增加，其时间推理能力持续受益。
3. 指标互补性：两种机制在预测风险上具有互补性。ExPool 主要提升了模型的特异性（Specificity，即正确识别阴性病例的能力），而 MARL 主要提升了模型的敏感性（Sensitivity，即正确识别阳性病例的能力）。

意义与影响

Traj-Evolve 的提出标志着医疗 AI 从单纯的“数据驱动”向“经验与数据双驱动”的转变。

首先，它证明了在多智能体系统中引入“记忆”和“经验复用”机制的有效性。通过 ExPool，模型不再仅仅依赖当前的输入数据，而是能够动态地调用历史知识库，这极大地增强了模型在长周期、多模态医疗数据中的推理深度。

其次，该研究揭示了不同优化机制在医疗预测中的具体作用差异。特异性与敏感性的互补意味着，在实际临床部署中，可以通过调整 ExPool 和 MARL 的权重或规模，来适应不同的临床场景需求（例如，筛查场景侧重高敏感性，确诊场景侧重高特异性）。

最后，Traj-Evolve 为处理稀疏、嘈杂的纵向医疗数据提供了一套新的范式。它表明，结合非参数化的检索增强与参数化的强化学习微调，是解决复杂医疗决策中上下文依赖和长期推理问题的有效途径。这一架构不仅适用于肺癌检测，也为其他需要长期轨迹建模的慢性病管理或罕见病诊断提供了可借鉴的技术路线。

查看原文 →arxiv.org