What Drives Interactive Improvement from Feedback?
AI 深度解读
背景
在多轮语言智能体(Language Agent)的交互场景中,向模型提供自然语言反馈是提升其性能的主流手段之一。然而,当智能体在多轮交互后表现出更高的准确率时,这种提升究竟源于反馈本身带来的有效指导,还是仅仅得益于“重复尝试”(Resampling)、格式修正或额外的测试时计算?这一问题在学术界长期缺乏严谨的归因分析。由于缺乏受控的评估基线,许多研究将多轮交互后的性能提升直接归功于“反馈的有效性”,可能导致对智能体真实交互能力的高估。
核心内容
为了厘清反馈在交互式改进中的真实作用,本研究提出了一种受控的“学生-教师”(Student-Team)评估协议,旨在将“反馈带来的增益”与“单纯重试或额外计算带来的增益”分离开来。
研究在 Omni-MATH、Codeforces、BBEH Linguini 和 ARC-AGI1 四个具有代表性的基准测试上,评估了 13 个开放权重模型。这些模型分别在“学生”和“教师”两个角色下进行配置和测试。实验对比了三种交互模式:外部反馈、自我反馈和无指导的自我
查看原文 →arxiv.org
