← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

清华博士开源COMPASS司南:构建AI Agent个性化任务对齐系统

原标题:【开源 Skills】清华博士自用的科研&编程 Agent 生态:COMPASS 司南

速览

COMPASS司南是一个开源的AI Agent技能系统,旨在让AI更懂用户、看清全局并避免任务跑偏。它包含三个核心技能:通过user-profile-keeper本地维护可审计的用户画像,利用task-forest构建任务森林与DAG视图以追踪进度,并使用task-clarifier将模糊需求对齐为可执行契约。该系统兼容Codex、Claude Code等主流Agent,支持跨Session协作,帮助开发者高效完成科研与编程任务。

AI 深度解读

深度解读:COMPASS 司南——构建 AI Agent 的长期记忆与任务对齐生态

背景

随着大语言模型(LLM)在科研、编程及复杂工作流中的应用日益深入,开发者发现单一的 Prompt 工程已难以满足长周期、高复杂度任务的需求。普通 Agent 虽然擅长执行当前指令,但在面对跨 Session 协作、长期目标维护以及用户个性化偏好时,往往存在三大痛点:

  1. 不了解用户:缺乏对用户沟通偏好、风险边界及协作习惯的记忆,导致每次交互都需重新建立上下文。
  2. 看不到全局:新 Session 仅能获取局部上下文,难以判断当前动作与长期宏观目标的关联,容易陷入“只见树木不见森林”的困境。
  3. 容易目标漂移:在执行一系列子任务后,可能发现最终产出与原始目的偏离,甚至执行了不必要的操作,造成算力浪费和时间成本。

在此背景下,清华博士 dongshuyan 开源了 COMPASS 司南(Personal Alignment Skills OS for AI Agents)。这是一个基于 SKILL.md 标准的开源 Skills 生态系统,旨在为 AI Agent 提供一个“长期工作底座”。它通过整合用户画像、任务图谱和需求对齐机制,让 Agent 能够“懂你、看全局、不跑偏”,从而显著提升科研与编程场景下的协作效率。

核心内容

COMPASS 的核心设计理念是将“知人、知事、知向”三个维度模块化,形成一套可复用、可审计的 Skills 系统。该系统完全本地化运行,不依赖云服务,确保数据隐私。

1. 三省模型架构

COMPASS 由三个核心 Skill 组成,分别对应人类协作中的三个关键认知层面:

  • 知人:user-profile-keeper(用户画像维护者)

    • 功能:在本地维护一个可审计、可纠错、可撤回的用户协作画像。记录内容包括沟通偏好、风险确认方式、能力边界及常见遗漏点。
    • 隐私保护:仅保存低敏协作信号,不保存 Secret、Token 或密码;不上传数据。
    • 联动机制task-clarifier 可读取其生成的低敏摘要,以符合用户习惯的方式提问;若无画像,task-clarifier 仍可独立工作。
    • 存储位置:默认保存在 ~/.compass-skills/user-profiles/v1,可通过环境变量 COMPASS_USER_PROFILE_HOME 修改。
  • 知事:task-forest(任务森林/总控)

    • 功能:在 Workspace 内维护任务森林(Task Forest)和有向无环图(DAG)。记录长期目标、子任务、依赖关系、进度、偏差、待办事项(Todo)及历史快照。
    • 可视化:支持生成 HTML 格式的树视图、DAG 视图及任务详情卡,便于离线查看和跨 Session 交接。
    • 工作流:通过 Proposal 机制,先由 Agent 生成任务结构建议,经用户确认后 Apply,再运行验证和导出。
    • 存储位置:默认保存在 .agent-workbench/task-forest/
  • 知向:task-clarifier(需求对齐与风险门禁)

    • 功能:作为任务路由器,在任务执行前进行“三方对齐”(用户想清楚、Agent 听准确、用户确认没跑偏)。
    • 智能判断:并非盲目提问,而是判断是否可以通过读取文件、联网或上下文解决不确定性。仅当涉及范围、方法、证据、格式、安全或验收标准等关键变更时,才向用户提问。
    • 状态输出:明确输出当前状态是 Proceed(继续)、Research-first(先研究)、Ask(询问)、Confirm(确认)、Offer-method-choice(提供方法选择)还是 Block(阻塞)。

2. 安装与兼容性

COMPASS 是一个 Agent-agnostic(与具体 Agent 无关)的 SKILL.md 包,兼容多种主流 AI 编程助手:

  • 兼容 Agent:Codex、Claude Code、OpenClaw、OpenCode 以及其他支持 SKILL.md、YAML frontmatter 和 Markdown instructions 的 Agent。
  • 安装方式
    • 自动安装:提供了一段 Prompt,引导 Agent 审查代码安全性后,自动将 skills/ 目录复制到目标 Agent 的本地 Skills 目录。
    • 手动安装:将 skills/ 下的三个目录复制到目标 Agent 的自定义 Skills 目录。
  • 环境支持:基于 Python 标准库,支持 macOS、Windows、Linux。脚本按本地文件工作,无网络上传、无 Cookie/Credential 读取。

3. 典型使用场景

  • 场景一:需求澄清 在任务开始前,使用 $task-clarifier 将模糊想法转化为可执行契约。例如,用户提出一个模糊需求,Agent 会先检查是否有文件可参考,若无,则精准询问关键约束,避免无效交互。
  • 场景二:长期任务管理 在 Session 进行中或结束时,使用 $task-forest 自动构建任务树。Agent 会将当前进度、偏差和决策写入 Proposal,用户确认后生成 DAG 视图。下一个 Session 启动时,Agent 可读取该视图,明确“为什么做、做到哪、下一步做什么”。
  • 场景三:个性化协作 通过 $user-profile-keeper 初始化画像后,Agent 会逐渐适应用户的沟通风格。例如,若用户偏好简洁指令,Agent 在后续提问时会减少冗余解释,仅在关键风险点寻求确认。

关键要点

  • 本地优先与隐私安全:所有数据(用户画像、任务图)均存储在本地文件或 SQLite 中,明确承诺不上传用户数据、不读取浏览器 Cookie 或凭证。但需注意,本地明文存储仍可能被同一机器上的其他进程读取,因此严禁保存高敏感信息(如私钥、密码)。
  • 三方对齐机制task-clarifier 的核心价值在于确保“用户意图”与“Agent 理解”的一致性,通过结构化输出(Proceed/Ask/Block 等)降低沟通成本。
  • 非侵入式集成:COMPASS 不替代 Agent 的执行能力,而是作为“元技能”存在。它通过 SKILL.md 标准实现模块化,可与其他 Skills 共存。
  • Proposal 确认流程:无论是更新用户画像还是构建任务森林,均采用“生成 Proposal -> 用户确认 -> Apply”的流程,确保用户对 AI 的行为拥有最终控制权。
  • 跨 Session 连续性:通过持久化的任务森林和用户画像,解决了 AI Agent 在重启或新会话中“失忆”的问题,实现了真正的长期协作。
  • 开源与社区驱动:项目完全开源,遵循 LINUX DO 社区推广规范,提供详细的安装 Prompt 和中文教程,降低了使用门槛。

意义与影响

COMPASS 司南的出现,标志着 AI 辅助开发从“单次对话执行”向“长期智能协作”迈出了重要一步。

  1. 重新定义 Agent 的“记忆”与“个性”:传统的 RAG(检索增强生成)主要解决知识检索问题,而 COMPASS 通过 user-profile-keeper 解决了“协作记忆”问题。它让 AI 不仅知道“事实”,还知道“你是谁”、“你习惯怎么工作”,从而提供更个性化的服务。
  2. 提升复杂任务的可靠性:在科研和大型编程项目中,目标漂移是常见痛点。task-forest 提供的 DAG 视图和偏差检测机制,为复杂任务提供了可视化的“导航仪”,确保每一步行动都服务于最终目标。
  3. 推动 Skills 生态标准化:COMPASS 严格遵循 SKILL.md 标准,证明了模块化 Skills 在跨平台 Agent 中的通用性。这种“即插即用”的设计降低了开发者构建自定义 AI 工作流的难度,有助于形成丰富的 AI 技能市场。
  4. 隐私保护与本地化趋势:在数据隐私日益受到重视的今天,COMPASS 坚持本地化
查看原文 →linux.do