技术博客arXiv cs.CL·4 小时前

SHAP与LLM解释力对比：基于量规的教学质量评估

原标题：From Scoring to Explanations: Evaluating SHAP and LLM Rationales for Rubric-based Teaching Quality Assessment

速览

该研究提出结合SHAP值与大语言模型（LLM）生成理由的框架，用于评估基于量规的教学质量评分。在CLASS框架反馈质量维度上的实验显示，微调语言模型在预测精度上优于LLM，但SHAP生成的解释在忠实度和跨架构迁移性上显著优于LLM理由。结果表明SHAP能为高风险教育场景提供更可靠、可迁移的解释依据。

AI 深度解读

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）

查看原文 →arxiv.org

SHAP与LLM解释力对比：基于量规的教学质量评估

速览

AI 深度解读

相关推荐