技术博客arXiv cs.AI·3 小时前

What Drives Interactive Improvement from Feedback?

AI 深度解读

背景

在多轮语言智能体（Language Agent）的交互场景中，向模型提供自然语言反馈是提升其性能的主流手段之一。然而，当智能体在多轮交互后表现出更高的准确率时，这种提升究竟源于反馈本身带来的有效指导，还是仅仅得益于“重复尝试”（Resampling）、格式修正或额外的测试时计算？这一问题在学术界长期缺乏严谨的归因分析。由于缺乏受控的评估基线，许多研究将多轮交互后的性能提升直接归功于“反馈的有效性”，可能导致对智能体真实交互能力的高估。

核心内容

为了厘清反馈在交互式改进中的真实作用，本研究提出了一种受控的“学生-教师”（Student-Team）评估协议，旨在将“反馈带来的增益”与“单纯重试或额外计算带来的增益”分离开来。

研究在 Omni-MATH、Codeforces、BBEH Linguini 和 ARC-AGI1 四个具有代表性的基准测试上，评估了 13 个开放权重模型。这些模型分别在“学生”和“教师”两个角色下进行配置和测试。实验对比了三种交互模式：外部反馈、自我反馈和无指导的自我

查看原文 →arxiv.org

What Drives Interactive Improvement from Feedback?

AI 深度解读

背景

核心内容

相关推荐