← 返回信息流
AI 资讯量子位·3 小时前

明略科技开源Octo:实现Agent间互联

原标题:Agent之间,有互联网了!

速览

明略科技近日开源发布了Octo项目。该项目的核心目标是解决当前AI Agent之间缺乏统一通信标准的问题,实现不同智能体间的互联互通。此举有望推动多智能体协作生态的发展,提升AI应用的自动化与协同能力。

AI 深度解读

背景

随着大语言模型(LLM)能力的提升,AI 应用正从单一的“聊天机器人”形态向更复杂的“智能体(Agent)”形态演进。然而,当前的 AI 使用场景大多处于“单机”状态:Claude Code 负责写代码,Codex 处理任务,另一个 Agent 做调研,彼此之间缺乏有效的协作机制。

当企业内部的 Agent 数量从个位数增加到数十甚至上百个时,简单的工具调用已无法满足需求。组织需要一张能够支持分工、沟通、交接、验收以及经验沉淀的网络。在此背景下,明略科技(Minglue Technology)开源发布了 Octo,旨在构建一个开源可信的 Agent 协作网络,让人、Agent 和外部工具进入同一套协作系统,解决多 Agent 环境下的组织协作难题。

核心内容

Octo 的核心理念可以概括为 “Agents do. Humans decide.”(Agent 执行,人类决策)。它不仅仅是一个 AI 工具,更是一个将 AI 融入组织流程的数字劳动力管理平台。其核心架构围绕以下三个维度展开:

1. Agent 的“工位”概念:Bot、Channel/Thread、Matter

Octo 试图赋予 Agent 类似人类员工的身份和协作空间:

  • Bot(数字同事):Agent 不再只是临时的功能按钮,而是以 Bot 身份进入团队。每个 Bot 拥有独立的 AgentCard,包含身份、能力边界、归属及工作履历。系统支持接入 OpenClaw、Hermes、Codex、Claude Code、WorkBuddy 等主流 Agent 工具,实现统一管理和能力匹配。
  • Channel/Thread(协作空间)
    • Channel:类似项目群或工作频道,用于对齐意图、讨论方案、派发任务。与普通群聊不同,Agent 在此不仅是被动响应,而是能接收上下文并主动推进任务。
    • Thread:针对具体事项(如产品发布中的技术稿、文案等)的独立线程,确保讨论脉络、过程和结论不被冲散,保持上下文连贯。
  • Matter(行动交付):解决“聊天变行动”的问题。当讨论产生待办事项,Agent 可自动总结要点,经人工确认后创建 Matter。Matter 包含负责人、交付物、验收标准及从 Brief 到验收结论的完整记录,使 AI 的工作成果可追踪、可复盘、可验收。

2. 六种协作模式

Octo 提供了六种结构化的多 Agent 协作模式,以应对不同的工作场景:

  1. Solo(单人完成):单个 Bot 独立完成边界清晰的小任务,如改文案、整理纪要。
  2. Roundtable(圆桌讨论):多个 Bot 围绕同一问题公开讨论,适合头脑风暴、多角度分析。例如,由技术、用户、商业视角的 Bot 分别提供判断,由 Leader 收束。
  3. Critic(独立审核):执行与审核分离。一个 Bot 执行,另一个 Bot 审核并有权打回,适用于代码审查、事实核查等对质量敏感的场景。
  4. Pipeline(流水线):A 做完交给 B,B 做完交给 C,每一步产出作为下一步输入,适用于有明确先后顺序的多步任务(如调研->分析->报告->润色)。
  5. Split(分头干):大任务拆分为独立模块,不同 Bot 并行处理,最后由 Leader 合并,适用于资料量大、模块独立的任务(如行业研究中分国别、分领域调研)。
  6. Swarm(竞选择优):同一题目发给多个 Bot 独立完成,最后选出最佳方案,适用于创意型任务(如标题、视觉概念、命名)。

3. 多端覆盖与产品形态

为了融入现有工作流,Octo 覆盖了多种终端入口:

  • Web App:完整的协作工作台,集中管理 Channel、Matter、Bot 记录及项目进展,适合复杂项目管理。
  • 移动端(iOS/Android):用于关键节点的反馈与验收,如查看阶段成果、拍板通过或打回补充。
  • 浏览器插件:在不打断现有工作流的前提下,直接在当前页面(如文档、GitHub Issue)呼出 Agent,带入页面上下文进行总结、翻译或续写。
  • CLI(命令行界面):面向开发者和 Agent 原生操作,将 Agent 任务与终端工作流(代码、自动化)结合。

4. 开源与私有化部署

Octo 强调开源和私有化部署,以保护企业的核心资产。在 PrivateAI 时代,企业真正有价值的数据并非单次回答,而是背后的业务上下文、协作记录、偏好判断和工作方法。私有化部署确保这些数据沉淀在企业自身环境中,避免资产流失,并支持组织风格的长期积累。

关键要点

  • 核心理念:Octo 旨在构建开源可信的 Agent 协作网络,实现 “Agents do. Humans decide.”,即 Agent 负责执行,人类负责关键节点的判断与决策。
  • 身份管理:通过 Bot 概念,将 Agent 从工具入口转变为拥有身份、能力边界和工作履历的“数字同事”,支持接入多种主流 Agent 工具。
  • 协作结构化
    • 通过 ChannelThread 解决协作空间和上下文连贯性问题。
    • 通过 Matter 将非结构化的聊天转化为可追踪、可验收的结构化交付物。
  • 六种协作模式:提供 Solo、Roundtable、Critic、Pipeline、Split、Swarm 六种模式,覆盖从单人执行到复杂并行、审核、竞选的多种业务场景。
  • 全场景覆盖:通过 Web App、移动端、浏览器插件和 CLI 四个端,实现 Agent 在文档、代码平台、浏览器和终端等高频工作场景中的无缝嵌入。
  • 资产沉淀:协作过程中沉淀三类核心资产:
    • Context(上下文):项目背景、历史决策,降低新成员/新 Bot 的对齐成本。
    • Taste(偏好):记录人工验收、批注中的风格偏好,指导 Agent 后续输出。
    • Skill(技能):固化组织内部的做事规范、模板和方法论,实现复用。
  • O.C.T.O. 含义:代表 Open(开放/自部署)、Context(上下文流动)、Taste(偏好保留)、Orchestration(编排协作)。
  • 趋势判断:AI 应用正从“个人效率工具”向“组织协作网络”迁移。互联网连接了计算机,Octo 试图连接 Agent,释放网络效应,使 AI 从助手进化为同事。

意义与影响

Octo 的发布标志着 AI 应用进入了一个新阶段:从单点效率提升转向组织级的协作重构。

  1. 重构组织协作方式:传统的 IM 工具(如飞书、Slack、钉钉)主要为人和人设计,难以有效处理 Agent 的身份管理、任务追踪和复杂协作逻辑。Octo 填补了这一空白,为“人-Agent-Agent”混合协作提供了基础设施。
  2. 确立“数字劳动力”地位:通过 Matter 和验收机制,AI 的工作成果变得可量化、可管理、可追责。这使得 Agent 能够真正作为数字劳动力融入企业流程,而非仅仅作为辅助搜索或生成的工具。
  3. 数据主权与资产沉淀:强调开源和私有化部署,回应了企业对数据安全和核心知识资产(Context, Taste, Skill)掌控的关切。这有助于企业在更换模型或升级系统时,保留组织特有的工作方法和偏好,避免“模型依赖”导致的知识流失。
  4. 推动 Agent 生态互联:正如互联网让计算机产生网络效应,Octo 试图让分散的 Agent 产生协作效应。当 Agent 能够在统一的规则下分工、交接和验收时,整个组织的智能化水平和生产力上限将被大幅打破。

总之,Octo 不仅是一个技术产品,更是对 AI 时代组织形态的一种探索。它试图解决的核心问题是:当 Agent 数量激增时,如何通过标准化的协作协议和基础设施,让 AI 真正懂业务、懂组织,并成为可信赖的数字

查看原文 →qbitai.com