AI 资讯量子位·1 小时前

AReaL 2.0开源：打造自演进智能体RL基础设施

原标题：让Agent越用越强：AReaL 2.0开源，打造面向自演进智能体的RL基础设施

速览

AReaL 2.0作为开源项目，提供了构建自演进智能体的强化学习基础设施，帮助开发者创建AI智能体。项目与社区共同推进，旨在推动自演进智能体生态发展，为AI行业带来新机遇。未来，AReaL 2.0将助力更多创新应用，推动AI技术的普及和进步。

AI 深度解读

让Agent越用越强：AReaL 2.0开源，打造面向自演进智能体的RL基础设施

背景

2024年，AReaL项目由蚂蚁集团、清华大学和香港科技大学等团队发起。2026年5月，AReaL正式从蚂蚁InclusionAI孵化成为独立开源社区，并加入PyTorch Foundation Ecosystem项目。2026年7月2日，开源强化学习基础设施项目AReaL正式发布2.0版本。

核心内容

AReaL 2.0是一套完整的在线强化学习（Online RL）基础设施，旨在打通基础模型训练与现代智能体应用之间的链路，为真实业务场景中的Agent提供高效的强化学习训练支撑。

Agent上线后，每天在企业系统中完成写代码、查资料、调用工具等复杂任务，但能力难以持续成长。AReaL 2.0正是为解决这一问题而设计：无需重新开发Agent，只需将Agent原本发给大模型的请求经过AReaL 2.0的统一推理入口，即可接入在线强化学习流程。

以Hermes Agent为例，Hermes依然正常接收任务、规划步骤并调用模型，而AReaL 2.0在后台记录Agent完成任务时的关键交互过程（包括多轮对话、工具调用、执行结果）。任务结束后，系统结合用户反馈或奖励信号，将这些真实轨迹用于后续训练。开发者可将自己的Agent和任务环境直接接入同样的流程。

AReaL 2.0通过数据代理机制，确保Agent接触到的真实数据（如代码库、客户信息、企业知识库）在进入训练流程时完成权限控制、数据脱敏、隔离和审计，从而实现安全可控的持续学习。

团队指出，Agent能力提升的真正瓶颈并非模型本身或算法先进性，而是缺少服务真实Agent的在线强化学习基础设施。AReaL 2.0正是将Agent服务、真实任务轨迹、数据治理和在线强化学习训练连接起来的架构升级。

AReaL 2.0技术报告和代码已开源。

关键要点

AReaL 2.0是2024年由蚂蚁集团、清华大学、香港科技大学等发起的开源强化学习基础设施项目，已在PyTorch Foundation Ecosystem生态中独立发展
核心功能是面向已上线真实业务场景的Agent，提供在线强化学习（Online RL）支持，实现“用中学习、用后提升”
Agent通过统一推理入口接入AReaL 2.0后，其多轮对话、工具调用、执行结果和反馈信号可被记录并转化为后续训练数据
系统内置数据代理机制，确保企业级真实任务数据在训练前完成权限控制、脱敏、隔离和审计
解决了从“会使用工具”到“能在使用中持续学习”之间的基础设施缺失问题
支持替换Hermes Agent或自定义Agent环境，直接搭建生产级在线强化学习流程
面向下一代智能体应用演进范式：Agent不再是一次性训练和部署，而是能在真实环境中通过成功与失败反馈持续进化
项目由PyTorch Foundation Ecosystem支持，未来将围绕在线强化学习、自动化评估和多模态智能体训练迭代

意义与影响

AReaL 2.0让Agent真正实现“越用越强”的闭环：在安全可控的前提下，将真实业务中产生的海量经验转化为持续能力提升，避免了人工构造数据、离线训练和重新部署的低效路径。

在企业场景中，这一基础设施尤为关键。企业Agent面对不断变化的代码库、业务流程、用户需求和工具系统，AReaL 2.0能够确保Agent长期适应环境，而非上线即基本固定。

从长远看，AReaL 2.0指向的是下一代智能体应用的演进范式：Agent成为真正的自演进智能体，而非一次性工具。这一升级不仅补齐了基础设施短板，也为华为云、MindLab等产业与开源生态伙伴提供了共建基础。

目前，AReaL 2.0已开源，其落地将加速自演进智能体生态的实际落地，成为Agent从“会用”到“会学、会进化”的关键基础设施支撑。

查看原文 →qbitai.com

AReaL 2.0开源：打造自演进智能体RL基础设施

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐