明略科技开源Octo:实现Agent间互联
速览
明略科技近日开源发布了Octo项目。该项目的核心目标是解决当前AI Agent之间缺乏统一通信标准的问题,实现不同智能体间的互联互通。此举有望推动多智能体协作生态的发展,提升AI应用的自动化与协同能力。
AI 深度解读
背景
随着大语言模型(LLM)能力的提升,AI 应用正从单一的“聊天机器人”形态向更复杂的“智能体(Agent)”形态演进。然而,当前的 AI 使用场景大多处于“单机”状态:Claude Code 负责写代码,Codex 处理任务,另一个 Agent 做调研,彼此之间缺乏有效的协作机制。
当企业内部的 Agent 数量从个位数增加到数十甚至上百个时,简单的工具调用已无法满足需求。组织需要一张能够支持分工、沟通、交接、验收以及经验沉淀的网络。在此背景下,明略科技(Minglue Technology)开源发布了 Octo,旨在构建一个开源可信的 Agent 协作网络,让人、Agent 和外部工具进入同一套协作系统,解决多 Agent 环境下的组织协作难题。
核心内容
Octo 的核心理念可以概括为 “Agents do. Humans decide.”(Agent 执行,人类决策)。它不仅仅是一个 AI 工具,更是一个将 AI 融入组织流程的数字劳动力管理平台。其核心架构围绕以下三个维度展开:
1. Agent 的“工位”概念:Bot、Channel/Thread、Matter
Octo 试图赋予 Agent 类似人类员工的身份和协作空间:
- Bot(数字同事):Agent 不再只是临时的功能按钮,而是以 Bot 身份进入团队。每个 Bot 拥有独立的 AgentCard,包含身份、能力边界、归属及工作履历。系统支持接入 OpenClaw、Hermes、Codex、Claude Code、WorkBuddy 等主流 Agent 工具,实现统一管理和能力匹配。
- Channel/Thread(协作空间):
- Channel:类似项目群或工作频道,用于对齐意图、讨论方案、派发任务。与普通群聊不同,Agent 在此不仅是被动响应,而是能接收上下文并主动推进任务。
- Thread:针对具体事项(如产品发布中的技术稿、文案等)的独立线程,确保讨论脉络、过程和结论不被冲散,保持上下文连贯。
- Matter(行动交付):解决“聊天变行动”的问题。当讨论产生待办事项,Agent 可自动总结要点,经人工确认后创建 Matter。Matter 包含负责人、交付物、验收标准及从 Brief 到验收结论的完整记录,使 AI 的工作成果可追踪、可复盘、可验收。
2. 六种协作模式
Octo 提供了六种结构化的多 Agent 协作模式,以应对不同的工作场景:
- Solo(单人完成):单个 Bot 独立完成边界清晰的小任务,如改文案、整理纪要。
- Roundtable(圆桌讨论):多个 Bot 围绕同一问题公开讨论,适合头脑风暴、多角度分析。例如,由技术、用户、商业视角的 Bot 分别提供判断,由 Leader 收束。
- Critic(独立审核):执行与审核分离。一个 Bot 执行,另一个 Bot 审核并有权打回,适用于代码审查、事实核查等对质量敏感的场景。
- Pipeline(流水线):A 做完交给 B,B 做完交给 C,每一步产出作为下一步输入,适用于有明确先后顺序的多步任务(如调研->分析->报告->润色)。
- Split(分头干):大任务拆分为独立模块,不同 Bot 并行处理,最后由 Leader 合并,适用于资料量大、模块独立的任务(如行业研究中分国别、分领域调研)。
- Swarm(竞选择优):同一题目发给多个 Bot 独立完成,最后选出最佳方案,适用于创意型任务(如标题、视觉概念、命名)。
3. 多端覆盖与产品形态
为了融入现有工作流,Octo 覆盖了多种终端入口:
- Web App:完整的协作工作台,集中管理 Channel、Matter、Bot 记录及项目进展,适合复杂项目管理。
- 移动端(iOS/Android):用于关键节点的反馈与验收,如查看阶段成果、拍板通过或打回补充。
- 浏览器插件:在不打断现有工作流的前提下,直接在当前页面(如文档、GitHub Issue)呼出 Agent,带入页面上下文进行总结、翻译或续写。
- CLI(命令行界面):面向开发者和 Agent 原生操作,将 Agent 任务与终端工作流(代码、自动化)结合。
4. 开源与私有化部署
Octo 强调开源和私有化部署,以保护企业的核心资产。在 PrivateAI 时代,企业真正有价值的数据并非单次回答,而是背后的业务上下文、协作记录、偏好判断和工作方法。私有化部署确保这些数据沉淀在企业自身环境中,避免资产流失,并支持组织风格的长期积累。
关键要点
- 核心理念:Octo 旨在构建开源可信的 Agent 协作网络,实现 “Agents do. Humans decide.”,即 Agent 负责执行,人类负责关键节点的判断与决策。
- 身份管理:通过 Bot 概念,将 Agent 从工具入口转变为拥有身份、能力边界和工作履历的“数字同事”,支持接入多种主流 Agent 工具。
- 协作结构化:
- 通过 Channel 和 Thread 解决协作空间和上下文连贯性问题。
- 通过 Matter 将非结构化的聊天转化为可追踪、可验收的结构化交付物。
- 六种协作模式:提供 Solo、Roundtable、Critic、Pipeline、Split、Swarm 六种模式,覆盖从单人执行到复杂并行、审核、竞选的多种业务场景。
- 全场景覆盖:通过 Web App、移动端、浏览器插件和 CLI 四个端,实现 Agent 在文档、代码平台、浏览器和终端等高频工作场景中的无缝嵌入。
- 资产沉淀:协作过程中沉淀三类核心资产:
- Context(上下文):项目背景、历史决策,降低新成员/新 Bot 的对齐成本。
- Taste(偏好):记录人工验收、批注中的风格偏好,指导 Agent 后续输出。
- Skill(技能):固化组织内部的做事规范、模板和方法论,实现复用。
- O.C.T.O. 含义:代表 Open(开放/自部署)、Context(上下文流动)、Taste(偏好保留)、Orchestration(编排协作)。
- 趋势判断:AI 应用正从“个人效率工具”向“组织协作网络”迁移。互联网连接了计算机,Octo 试图连接 Agent,释放网络效应,使 AI 从助手进化为同事。
意义与影响
Octo 的发布标志着 AI 应用进入了一个新阶段:从单点效率提升转向组织级的协作重构。
- 重构组织协作方式:传统的 IM 工具(如飞书、Slack、钉钉)主要为人和人设计,难以有效处理 Agent 的身份管理、任务追踪和复杂协作逻辑。Octo 填补了这一空白,为“人-Agent-Agent”混合协作提供了基础设施。
- 确立“数字劳动力”地位:通过 Matter 和验收机制,AI 的工作成果变得可量化、可管理、可追责。这使得 Agent 能够真正作为数字劳动力融入企业流程,而非仅仅作为辅助搜索或生成的工具。
- 数据主权与资产沉淀:强调开源和私有化部署,回应了企业对数据安全和核心知识资产(Context, Taste, Skill)掌控的关切。这有助于企业在更换模型或升级系统时,保留组织特有的工作方法和偏好,避免“模型依赖”导致的知识流失。
- 推动 Agent 生态互联:正如互联网让计算机产生网络效应,Octo 试图让分散的 Agent 产生协作效应。当 Agent 能够在统一的规则下分工、交接和验收时,整个组织的智能化水平和生产力上限将被大幅打破。
总之,Octo 不仅是一个技术产品,更是对 AI 时代组织形态的一种探索。它试图解决的核心问题是:当 Agent 数量激增时,如何通过标准化的协作协议和基础设施,让 AI 真正懂业务、懂组织,并成为可信赖的数字
