← 返回信息流
技术博客arXiv cs.CL·4 小时前

多智能体审计框架提升临床心理健康筛查推理可靠性

原标题:A Multi-Agent Audit Framework for High-Stakes Reasoning: Evaluation and Interpretability in Clinical Mental Health Screening

速览

针对大模型在高风险推理中幻觉多、可解释性差的问题,研究提出一种多智能体审计框架。该框架在临床心理健康筛查场景中,通过感知、知识检索、思维链推理及审计验证四步协作,有效减少推理偏差。实验显示,该框架在DAIC-WOZ数据集上显著优于单智能体基线,降低了PHQ-8抑郁严重程度预测的平均绝对误差,为AI辅助决策提供了高可解释性的通用范式。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org