← 返回信息流
技术博客arXiv cs.AI·1 天前

Recursive Self-Evolving Agents via Held-Out Selection

AI 深度解读

背景

随着 LLM 的演进,如何在不更新模型权重的前提下提升 Agent 的性能,成为了一个热门方向。当前的主流做法是让 Agent 通过演化自然语言工件(如 reflections、workflows、playbooks、cheatsheets 或优化后的 prompts)来条件化一个冻结的策略,从而实现自我改进。

然而

查看原文 →arxiv.org