基于大语言模型的多参考评估提升短语停顿标注效率
原标题:LLM-Based Multi-Reference Evaluation for Efficient and Robust Assessment of Phrase Break Annotations
速览
针对现有短语停顿标注评估中单参考假设和人工评估不可扩展的局限,研究提出基于大语言模型的多参考评估(LMRE)方法。该方法通过少量示例生成多种有效停顿划分,模拟韵律短语的一对多特性。在包含1356条标注的韩语测试集上,LMRE在接受行为和分数相关性上均比单参考评估更贴近人类判断。研究证实LMRE兼具可扩展性与多参考支持能力,展示了大模型在语音领域评估中的潜力。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
