多标签情感标注质量与一致性研究及评估框架
原标题:Quality and Agreement in Multilabel Emotion Annotation: A Case Study and Evaluation Framework
速览
本文通过多标签情感标注案例研究,指出传统方法将标注者差异视为噪声的局限性。研究提出使用软投票共享标签及强度加权变体,以结构化方式处理标注分歧。实验表明,相比硬标签,软监督能生成更贴合真实标注方差和不确定性的预测结果。该框架为多标签情感数据集的设计、聚合与评估提供了实用指导。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
