技术博客arXiv cs.AI·1 小时前

RareDxR1：自主医疗推理让罕见病诊断突破人工标注限制

原标题：RareDxR1: Autonomous Medical Reasoning for Rare Disease Diagnosis Beyond Human Annotation

速览

RareDxR1是首个端到端推理-centric大型语言模型，专为开放领域罕见病诊断设计，直接从非结构化临床笔记中进行诊断。它采用渐进式训练框架，将知识内化与自主进化学习结合，摆脱对结构化表型和预设决策的依赖。同时引入Reflection-Enhanced Reasoning Sampling（RERS）策略，通过学习失败案例合成专家级诊断轨迹，并提出双层课程强化学习逐步掌握诊断任务。实验结果显示其在多个基准测试中达到SOTA准确率，为罕见病诊断领域带来重大突破。

AI 深度解读

RareDxR1: Autonomous Medical Reasoning for Rare Disease Diagnosis Beyond Human Annotation

背景

罕见病诊断是临床中最关键且耗时的一项任务。患者症状往往以复杂、非结构化的形式呈现，医师需要从大量不规则数据中精确提取表型，并在一片广袅的疾病空间中执行多步推理。现有AI方法多采用流水线式表型提取或检索增强生成（RAG），这些方式因预定义本体、检索瓶颈和缺少诊断逻辑，容易造成信息丢失。RareDxR1正是为解决这些痛点而提出的端到端推理型大语言模型，直接从非结构化临床笔记进行开放域罕见病诊断。

核心内容

RareDxR1是一种专为开放域罕见病诊断设计的推理中心型大语言模型。它摒弃了传统依赖结构化表型和闭集决策的做法，采用渐进式端到端训练框架，通过知识内化与自主演化学习相结合的方式，直接将碎片化的罕见病知识深层嵌入模型参数。

为突破RAG的局限与表型限制，模型实现了对稀疏罕见病知识的深度参数化内化；为弥合模型生成与专家推理之间的差距，提出了Reflection-Enhanced Reasoning Sampling（RERS）策略。该策略通过学习失败案例合成专家级诊断轨迹，无需人工标注。

此外，还设计了双层课程强化学习方法，逐步掌握罕见病诊断能力。实验表明，RareDxR1在不同基准上均达到最先进准确率，标志着开放域罕见病诊断领域的重要突破。论文同时宣布代码与数据集将公开发布。

关键要点

RareDxR1是端到端推理型LLM，直接输入非结构化临床笔记进行开放域罕见病诊断，无需预定义本体或RAG。
通过渐进式端到端训练实现知识内化与自主演化学习，绕过结构化表型和闭集决策的依赖。
采用Reflection-Enhanced Reasoning Sampling（RERS）策略，合成专家诊断轨迹，无需人工标注即可提升推理能力。
提出双层课程强化学习方法，逐步提升罕见病诊断技能。
实验在多个基准上达标态最先进准确率，显著突破现有开放域罕见病诊断局限。
代码与数据集将公开发布，推动学术与临床应用。

意义与影响

RareDxR1突破了罕见病诊断的长期难题——由于疾病罕见且数据碎片化，现有AI长期受限于信息丢失与推理缺陷。该模型的自主推理能力为非专科医师提供可靠辅助，缩短诊断时间、降低误诊率，尤其在全球300亿人受累的罕见病领域意义重大。RERS等创新策略为后续多代理系统和强化学习在医学中的应用奠定基础。arXiv论文已于2026年6月30日提交，代码与数据集即将上线，将极大促进罕见病AI研究与临床转化。

查看原文 →arxiv.org

RareDxR1：自主医疗推理让罕见病诊断突破人工标注限制

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐