← 返回信息流
技术博客arXiv cs.CL·4 小时前

SHAP与LLM解释力对比:基于量规的教学质量评估

原标题:From Scoring to Explanations: Evaluating SHAP and LLM Rationales for Rubric-based Teaching Quality Assessment

速览

该研究提出结合SHAP值与大语言模型(LLM)生成理由的框架,用于评估基于量规的教学质量评分。在CLASS框架反馈质量维度上的实验显示,微调语言模型在预测精度上优于LLM,但SHAP生成的解释在忠实度和跨架构迁移性上显著优于LLM理由。结果表明SHAP能为高风险教育场景提供更可靠、可迁移的解释依据。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org