技术博客arXiv cs.CL·8 天前

每日剂量：工作流集成的大型语言模型自动化在放射肿瘤学临床摘要与试验识别中的应用

原标题：The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology

速览

该研究介绍了名为The Daily Dose (TDD)的系统，这是一个集成于常规放射肿瘤学实践中的大型语言模型驱动自动化系统，用于生成临床摘要和识别临床试验。通过为期一个月的部署后匿名调查评估发现，该系统获得了较高的可用性和满意度评分，且用户报告了显著的时间节省。结果表明，TDD能有效优化临床工作流，提升医生对电子健康记录摘要及潜在临床试验匹配的利用效率。

AI 深度解读

背景

在放射肿瘤学（Radiation Oncology）的日常临床实践中，医生面临着巨大的信息处理压力。随着电子健康记录（EHR）数据的日益丰富，以及临床试验（Clinical Trials）资源的不断扩展，如何高效地从海量数据中提取关键患者信息，并精准匹配潜在的临床试验机会，成为提升诊疗效率和质量的关键痛点。

传统的临床工作流程往往依赖于医生手动查阅病历、搜索试验库，这不仅耗时耗力，还容易因信息过载而导致遗漏或错误。随着大型语言模型（LLM）技术的成熟，将其集成到临床工作流中以实现自动化摘要和智能推荐成为可能。本研究旨在描述并早期评估一种名为“The Daily Dose”（TDD）的系统，该系统利用LLM驱动，旨在自动化临床摘要生成和临床试验识别，并将其无缝集成到常规的放射肿瘤学实践中，以减轻医生负担并优化诊疗决策。

核心内容

本研究介绍了一项混合方法评估，重点在于“The Daily Dose”（TDD）系统的早期临床部署效果。TDD是一个由大型语言模型驱动的系统，其核心功能包括两个方面：一是自动生成针对特定医生的患者临床状态摘要；二是自动识别与新患者或咨询就诊相关的潜在临床试验。

系统运作机制： TDD系统通过每日向医生发送特定的电子邮件，实现自动化工作流集成。这些邮件内容基于RadOnc-GPT（一种针对放射肿瘤学优化的LLM）生成，具体包含以下要素：

患者日程安排：整合患者的预约信息。
临床状态摘要：基于电子健康记录（EHR）数据生成的简洁摘要，帮助医生快速掌握患者最新状况。
临床试验识别：系统自动分析患者数据，识别并推荐可能相关的临床试验，供医生在新患者接诊或咨询时参考。

评估设计： 研究采用横断面、匿名的临床医生调查方法。调查在系统部署一个月后进行，旨在收集医生对系统可用性、满意度、感知有用性、对工作流程的影响、时间节省效果以及持续使用意愿的反馈。

数据收集与分析： 研究共收集了55名医生的有效反馈。在受访者中，94.5%（38人）从事放射肿瘤学专业，其中69.1%为主治医师。绝大多数参与者（83.6%）报告称每日或每周多次使用TDD系统。

评估指标与结果： 研究使用5点李克特量表（Likert scale）对多项指标进行评分，并采用Cronbach's $\alpha$系数评估问卷的内部一致性信度。主要结果如下：

可用性与满意度：平均得分3.89（标准差1.04），表明用户对系统的基本操作和整体体验持正面态度。
感知有用性：平均得分3.43（标准差1.24），显示用户认为系统在辅助临床决策方面具有一定的价值。
对工作流程的影响及未来使用意愿：平均得分3.80（标准差1.17），反映用户认为系统能积极影响工作流，并有意愿继续使用。
时间节省：总体满意度与感知的时间节省呈正相关（$p < .001$）。具体而言，27%的参与者估计每天可节省至少10分钟。
信度检验：问卷的整体Cronbach's $\alpha$系数为0.97，表明该评估工具具有极高的内部一致性信度。

关键要点

系统创新：TDD系统成功将LLM技术（RadOnc-GPT）集成到放射肿瘤学的日常邮件工作流中，实现了临床摘要和临床试验推荐的自动化。
高频使用：83.6%的医生每日或每周多次使用该系统，显示出较高的用户粘性和实际应用场景的契合度。
正面评价：用户在可用性、满意度（3.89/5）和对工作流的影响（3.80/5）方面给出了较高评分。
效率提升：系统被证实能节省医生时间，27%的用户每天节省10分钟以上，且满意度与时间节省感显著正相关。
方法学严谨：研究采用混合方法，通过高信度（$\alpha$=0.97）的匿名调查收集数据，确保了评估结果的可靠性。
早期阶段：这是系统的早期临床评估（部署一个月后），主要验证了概念的可行性和用户的初步接受度。

意义与影响

The Daily Dose（TDD）系统的早期评估结果具有多重重要意义。首先，它证明了大型语言模型在高度专业化的医疗领域（如放射肿瘤学）中具有实际应用的潜力。通过自动化处理EHR数据和匹配临床试验，TDD不仅减轻了医生的行政和信息检索负担，还可能通过提高临床试验的匹配效率，间接促进患者参与更多治疗选择。

其次，研究结果强调了“工作流集成”的重要性。TDD没有要求医生改变现有习惯，而是通过每日邮件这一低干扰、高触达的方式嵌入工作流，这种设计策略可能是其获得高用户接受度（83.6%高频使用）的关键。

最后，尽管样本量较小且为早期评估，但高信度的数据和积极的反馈为后续更大规模的随机对照试验（RCT）和长期效果研究奠定了基础。它提示我们，AI辅助工具若能精准解决临床痛点（如信息过载、时间压力），并无缝融入现有流程，将有望成为提升医疗质量和效率的重要工具。未来研究可进一步量化其对患者预后、诊断准确率及医疗成本的具体影响。

查看原文 →arxiv.org

每日剂量：工作流集成的大型语言模型自动化在放射肿瘤学临床摘要与试验识别中的应用

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐