← 返回信息流
技术博客arXiv cs.AI·4 小时前

Evoflux:通过推理时进化搜索提升紧凑智能体工具工作流执行能力

原标题:Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents

速览

紧凑语言模型在工具使用中常因工作流规划失败而受限,传统蒸馏方法难以覆盖复杂的恢复行为。Evoflux提出一种推理时进化搜索方法,通过结构化编辑和执行反馈动态修复工具工作流。在MCP-Bench基准测试中,该方法将小模型的执行可行性从3%提升至17-24%,优于SFT、DPO及ReAct等方法。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org