多智能体审计框架提升临床心理健康筛查推理可靠性
原标题:A Multi-Agent Audit Framework for High-Stakes Reasoning: Evaluation and Interpretability in Clinical Mental Health Screening
速览
针对大模型在高风险推理中幻觉多、可解释性差的问题,研究提出一种多智能体审计框架。该框架在临床心理健康筛查场景中,通过感知、知识检索、思维链推理及审计验证四步协作,有效减少推理偏差。实验显示,该框架在DAIC-WOZ数据集上显著优于单智能体基线,降低了PHQ-8抑郁严重程度预测的平均绝对误差,为AI辅助决策提供了高可解释性的通用范式。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
