← 返回信息流
技术博客arXiv cs.CL·3 小时前

ArcANE基准测试:角色扮演AI能否随剧情推进保持人设一致

原标题:ArcANE: Do Role-Playing Language Agents Stay in Character at the Right Time?

速览

现有基准多关注事实回忆,忽视了角色扮演语言代理(RPLA)应随故事进展动态调整性格与行为。研究推出ArcANE基准,涵盖17部小说和80个主要角色,通过心理轴线划分叙事阶段来评估模型一致性。实验显示, conditioning on Character Arc 的策略在所有模型和场景下均优于其他方法,尤其在原文未涉及的场景中优势明显。此外,基于相同数据微调的ArcANE-8B/32B模型进一步扩大了这一优势。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org