← 返回信息流
AI 资讯Hacker News·3 天前

Hermes Agent:开源持久记忆AI智能体

原标题:Hermes Agent – Open-Source AI Agent with Persistent Memory

速览

Hermes Agent是一款开源的AI智能体,其核心特性在于拥有持久记忆能力。这一功能使得智能体能够在多次交互中保留上下文信息,从而提供更连贯和个性化的服务体验。该项目的开源性质有助于推动AI智能体技术的发展与应用。

AI 深度解读

Hermes Agent:开源持久化 AI 智能体深度解读

背景

在 AI 应用日益普及的当下,大多数用户接触到的“AI 助手”本质上仍是基于会话的聊天机器人(Chatbot)或依附于特定 IDE 的代码副驾驶(Copilot)。这类工具通常缺乏长期记忆,每次交互都需要重新提供上下文,且数据往往依赖于云端 API,存在隐私泄露和厂商锁定的风险。

2026 年 2 月,Nous Research 发布了 Hermes Agent,这是一个开源的自主 AI 智能体(Autonomous AI Agent)。与传统的聊天界面不同,Hermes Agent 旨在成为运行在用户本地服务器或终端上的“持久化个人智能体”。它通过集成持久化记忆、自动化技能创建和多平台网关,试图解决 AI 助手“用完即忘”和“孤岛效应”的问题。该项目采用 MIT 许可证开源,强调数据本地化、无遥测追踪以及完全的用户控制权。

核心内容

Hermes Agent 不仅仅是一个对话接口,它是一个集成了记忆、技能、执行环境和多平台通信的完整生态系统。其核心功能架构如下:

1. 持久化记忆(Persistent Memory)

Hermes Agent 的核心差异化在于其“越用越聪明”的特性。它能够在不同会话之间记住用户的偏好、项目细节和环境配置。这意味着用户无需在每次交互时重复解释背景信息,智能体会随着运行时间的增加,对用户的工作习惯和需求有更深层次的理解。

2. 自动化技能创建(Automated Skill Creation)

当 Hermes Agent 解决一个复杂问题时,它会自动生成可复用的“技能文档”(Skill Document)。这些技能不仅防止了智能体遗忘特定问题的解决方案,还具备以下特性:

  • 可搜索与可共享:技能可以被索引并在团队或社区间分享。
  • 标准化兼容:兼容 agentskills.io 开源标准,确保了技能生态的互操作性。

3. 多平台网关(Multi-Platform Gateway)

Hermes Agent 提供了一个统一的网关进程,连接多种通信渠道,包括 Telegram、Discord、Slack、WhatsApp、Signal 以及命令行界面(CLI)。

  • 跨平台连续性:用户可以在 Telegram 上发起对话,随后在终端中继续;支持语音备忘录转录。
  • 计划自动化:内置 Cron 调度器,可设置每日报告、夜间备份、每周审计或晨间简报,并通过任意平台投递,实现无人值守运行。

4. 并行子智能体(Parallel Sub-Agents)

为了处理复杂的工作流,Hermes Agent 支持生成隔离的子智能体(Sub-Agents)。每个子智能体拥有独立的对话和终端环境,用于并行处理不同的工作流。通过 RPC(远程过程调用),多步骤流水线可以被压缩为具有零上下文成本的交互回合,极大提升了处理效率。

5. 完整的浏览器与网络控制

除了代码执行,Hermes Agent 还具备强大的 Web 交互能力:

  • 自动化操作:支持网页搜索、页面提取、全浏览器自动化(导航、点击、输入、截图)。
  • 多模态能力:集成视觉分析、图像生成、文本转语音(TTS)以及多模型推理能力。

6. 面向 MLOps 与 AI 训练的平台能力

Hermes Agent 不仅用于任务自动化,还设计为生成训练数据和运行强化学习(RL)实验的平台:

  • 批处理(Batch Processing):支持并行生成数千个工具调用轨迹(Trajectories),具备自动检查点功能,可配置工作线程、批次大小和工具集分布。
  • RL 训练:集成 Atropos 以进行智能体行为的强化学习,提供 11 种工具调用解析器,支持训练任何模型架构。
  • 轨迹导出:支持以 ShareGPT 格式导出对话,并具备轨迹压缩功能,以便将训练数据适配到 Token 预算中,用于微调(Fine-tuning)。

7. 安装与部署

  • 兼容性:原生支持 Linux、macOS 和 WSL2(Windows 原生支持处于实验阶段,建议通过 WSL2 运行)。
  • 极简安装:无需前置依赖,通过一条 curl 命令即可自动安装 uv、Python 3.11 并克隆仓库。无需 sudo 权限。
  • 配置灵活:支持通过 Nous Portal(OAuth)、OpenRouter(API Key)或自有端点连接 LLM 提供商。提供交互式设置向导。
  • 隐私承诺:所有数据保留在本地机器上,无遥测(Telemetry),无追踪,无云锁定。

关键要点

  • 持久化与自进化:Hermes Agent 通过持久化记忆和自动化技能创建,实现了智能体的自我进化,解决了传统 AI 助手上下文丢失的问题。
  • 去中心化与隐私优先:作为开源项目,它强调本地部署(Self-hosted),数据不出本地,无遥测数据上传,符合对隐私敏感的企业和个人用户需求。
  • 标准化与互操作性:技能系统兼容 agentskills.io 标准,支持跨平台通信(Telegram, Slack 等),打破了应用孤岛。
  • MLOps 友好:内置的轨迹导出和 RL 训练支持,使其成为生成微调数据和优化模型行为的理想工具,而不仅仅是终端用户工具。
  • 低门槛部署:一键安装脚本和无 sudo 要求降低了使用门槛,支持主流操作系统,但 Windows 用户需依赖 WSL2。
  • 自主性与并行处理:支持生成隔离的子智能体进行并行工作,并通过 RPC 优化上下文成本,适合处理复杂的多步骤任务。

意义与影响

Hermes Agent 的发布标志着 AI 智能体从“对话式交互”向“自主式服务”的转变。

  1. 重新定义 AI 助手形态:它挑战了以 Chatbot 为主导的 AI 交互范式,证明了智能体可以像长期员工一样,通过记忆和技能积累持续创造价值,而非仅仅作为临时的问答工具。
  2. 推动 AI 基础设施开源化:通过提供完整的技能标准(agentskills.io)和训练数据生成能力,Hermes Agent 为构建去中心化的 AI 技能生态和微调数据市场提供了基础设施。
  3. 强化数据主权:在云 AI 服务主导的市场中,Hermes Agent 坚持本地部署和无遥测策略,为注重数据隐私和安全合规的组织提供了可行的开源替代方案。
  4. 降低 AI 开发门槛:其内置的 RL 训练支持和轨迹导出功能,使得研究人员和开发者能够更轻松地利用智能体行为数据来优化模型,加速了 AI 模型的迭代周期。

总体而言,Hermes Agent 不仅是一个工具,更是一个旨在构建更智能、更自主、更隐私安全的个人 AI 生态系统的平台。

查看原文 →hermes-agent.org