人口统计元数据作为DistilBERT作文评分中的无关噪声
原标题:Demographic Metadata as Construct-Irrelevant Noise in DistilBERT-Based Automated Essay Scoring
速览
该研究探讨了在基于DistilBERT的自动作文评分系统中,采用朴素多模态融合策略整合人口统计元数据的影响。通过ASAP 2.0数据集的对比实验发现,早期融合人口统计信息导致模型预测准确率从QWK 0.727降至0.656,且验证损失增加。此外,实验模型还表现出更严重的评分偏差,降低了评分公平性。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
