技术博客arXiv cs.CL·4 小时前

证据稀疏时：对话与大模型轨迹的弱监督早期失败预警

原标题：When Evidence is Sparse: Weakly Supervised Early Failure Alerting in Dialogs and LLM-Agent Trajectories

速览

针对对话和大模型智能体轨迹中失败证据稀疏且滞后的问题，研究提出一种两阶段弱监督早期预警方法。该方法通过注意力机制从轨迹标签中学习稀疏的回合级失败证据，并结合alpha-STOP策略实现可控制的早期预警。实验表明，该方法在多个基准测试中显著优于现有触发策略，同时大幅降低训练成本。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）