← 返回信息流
技术博客arXiv cs.CL·4 小时前

证据稀疏时:对话与大模型轨迹的弱监督早期失败预警

原标题:When Evidence is Sparse: Weakly Supervised Early Failure Alerting in Dialogs and LLM-Agent Trajectories

速览

针对对话和大模型智能体轨迹中失败证据稀疏且滞后的问题,研究提出一种两阶段弱监督早期预警方法。该方法通过注意力机制从轨迹标签中学习稀疏的回合级失败证据,并结合alpha-STOP策略实现可控制的早期预警。实验表明,该方法在多个基准测试中显著优于现有触发策略,同时大幅降低训练成本。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org