技术博客arXiv cs.AI·2 小时前

OpenSkill：大模型智能体无需监督的自我进化框架

原标题：OpenSkill: Open-World Self-Evolution for LLM Agents

速览

现有方法依赖可用学习循环，而OpenSkill研究在仅有任务提示的开放世界中，让智能体从零构建技能和验证信号。该框架从文档、仓库和网络获取知识，合成可迁移技能，并通过自建的虚拟任务进行优化。实验表明，OpenSkill在三个基准测试中取得最佳自动通过率，且技能具有跨模型迁移能力。

AI 深度解读

OpenSkill：大语言模型智能体的开放世界自进化机制

背景

当前，基于大语言模型（LLM）的智能体（Agents）在部署后面临着严峻的适应性挑战。现有的主流研究大多假设存在一个“可用的学习循环”（usable learning loop），即智能体能够利用经过精心策划的技能库、成功的执行轨迹或明确的验证器信号（verifier signals）来进行自我改进。

然而，在真实的开放世界（Open-World）部署场景中，这种理想条件往往并不存在。现实环境通常不会提供现成的技能数据或反馈信号，智能体仅能接收到一个任务提示（task prompt）。在这种缺乏目标任务监督（target-task supervision）的情况下，智能体必须从零开始构建自身的技能体系以及验证自身行为正确性的信号。这一差距使得现有的自我进化方法难以直接应用于复杂的开放世界任务。

核心内容

针对上述挑战，研究团队提出了 OpenSkill 框架，旨在解决开放世界中的智能体自进化问题。该框架的核心逻辑在于：利用开放世界的资源，在没有任何目标任务监督的前提下，让智能体自主构建技能并建立验证机制。

OpenSkill 的工作流程主要包含以下三个关键阶段：

知识获取与锚点建立：智能体从文档、代码仓库（repositories）以及互联网等开放资源中获取接地气的知识（grounded knowledge）。同时，它从中提取出“验证锚点”（verification anchors）。这些锚点构成了后续技能训练和验证的基础参照系，而非依赖最终的任务答案。
技能合成与迁移：系统将获取的知识和验证锚点合成为可迁移的技能（transferable skills）。这一过程不依赖于特定任务的标签，而是基于通用知识的结构化提取。
基于虚拟任务的自我精炼：这是 OpenSkill 最具创新性的部分。智能体利用之前建立的验证锚点，构建“虚拟任务”（virtual tasks）。随后，它针对这些虚拟任务对合成的技能进行精炼和优化。关键在于，这种优化过程完全基于自建的验证锚点，而不是目标任务的真实答案。这意味着智能体在一个“监督独立”（supervision-independent）的环境中进行了自我练习。

通过这种方式，开放世界不仅提供了智能体需要学习的知识，还提供了一个无需目标监督即可进行练习的环境。目标任务的监督信号被保留用于最终的评估阶段，以确保在真实场景中的表现。

实验结果显示，在三个基准测试和两种目标智能体上，OpenSkill 在满足“无监督”约束的同时，取得了最佳的自动化通过率（automated pass rate）。

关键要点

突破监督依赖：OpenSkill 解决了在缺乏目标任务监督（no-supervision constraint）情况下的智能体自我进化问题，仅依靠任务提示和开放资源。
双重资源利用：开放世界资源同时充当了“学习知识”的来源和“监督独立”的练习环境。
自建验证机制：智能体从文档和代码库中提取“验证锚点”，并基于这些锚点构建虚拟任务来精炼技能，而非依赖真实答案。
技能的可迁移性：分析表明，OpenSkill 生成的技能可以在不同模型之间迁移，无需针对特定模型进行适配（model-specific adaptation）。
验证器的一致性：尽管从未接触过真实标签（ground-truth outcomes），OpenSkill 自建的验证器与真实结果保持高度一致。
性能表现：在多个基准测试中，OpenSkill 在自动化通过率上表现最优，证明了其在开放世界场景下的有效性。

意义与影响

OpenSkill 的提出标志着 LLM 智能体从“封闭环境下的预设技能”向“开放环境下的自主进化”迈出了重要一步。

首先，它极大地降低了智能体部署的门槛。在实际应用中，为每个新任务收集标注数据或设计验证器成本高昂且不现实。OpenSkill 证明了智能体可以利用互联网上现成的非结构化数据（如文档、代码库）实现自我能力的提升，这为构建通用型、自适应的智能体提供了新的范式。

其次，该研究揭示了“验证信号”可以不依赖于任务结果而存在。通过从知识源中提取逻辑锚点来构建验证体系，智能体能够在没有正确答案的情况下判断自身行为的合理性。这一机制对于解决大模型幻觉和确保推理过程的可靠性具有重要的理论价值。

最后，技能的可迁移性意味着 OpenSkill 生成的能力模块可以作为一个通用的“技能包”，在不同的大语言模型间共享和复用。这将促进智能体生态系统的标准化和模块化发展，加速 AI 智能体在复杂现实世界中的规模化应用。

查看原文 →arxiv.org