技术博客arXiv cs.CL·4 小时前

多标签情感标注质量与一致性研究及评估框架

原标题：Quality and Agreement in Multilabel Emotion Annotation: A Case Study and Evaluation Framework

速览

本文通过多标签情感标注案例研究，指出传统方法将标注者差异视为噪声的局限性。研究提出使用软投票共享标签及强度加权变体，以结构化方式处理标注分歧。实验表明，相比硬标签，软监督能生成更贴合真实标注方差和不确定性的预测结果。该框架为多标签情感数据集的设计、聚合与评估提供了实用指导。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）