← 返回信息流
Agent SkillLINUX DO · AI·2026/4/4

Clawd on Desk:支持多AI编程助手的桌面宠物

原标题:Clawd on Desk —— 感知 AI 编程助手状态的桌面宠物(支持 CC / Codex / Copilot / Gemini / Cursor)

速览

Clawd on Desk是一款开源桌面宠物工具,旨在解决开发者在使用AI编程助手时无法直观感知终端状态的问题。它支持Claude Code、Codex、Copilot、Gemini及Cursor等主流Agent,提供思考、报错等12种状态动画及毛玻璃权限审批气泡。该项目通过眼球追踪、多会话管理及远程SSH支持,显著优化了人机协作体验。

AI 深度解读

背景

在 AI 辅助编程日益普及的今天,开发者与 AI Agent(如 Claude Code、Codex CLI、Copilot CLI 等)的交互频率大幅增加。然而,传统的终端交互模式存在明显的痛点:当 AI 在后台执行代码、调用工具或进行思考时,终端窗口中滚动的文字日志往往难以让开发者直观地感知 AI 的实时状态。开发者不得不频繁切换窗口或紧盯终端,以确认 AI 是处于“思考”、“运行工具”还是“已完成”的状态,这种碎片化的注意力分散严重影响了开发心流。

在此背景下,开源项目 Clawd on Desk 应运而生。该项目由开发者 rullerzhou-afk 发起,旨在通过一只“桌面宠物”的形式,将 AI 编程助手的状态可视化。项目自今年 3 月初启动,初衷仅是解决个人使用 Claude Code 时的状态感知问题,但因其独特的交互理念,迅速在社区获得反响,GitHub 星标数突破 650+,并吸引了十多位贡献者共同参与迭代,功能从最初的状态显示扩展为支持多 Agent、权限审批、眼球追踪等丰富特性的完整工作流增强工具。

核心内容

Clawd on Desk 是一款跨平台(Windows 11 / macOS / Linux)的桌面宠物应用,核心功能是实时感知并可视化多种主流 AI 编程助手的工作状态。它通过不同的接入方式兼容多种 AI Agent,并提供丰富的视觉反馈和交互功能,旨在优化开发者与 AI 的协作体验。

1. 多 Agent 全支持与接入机制

Clawd 支持同时运行多个 AI Agent,并独立追踪每个会话的状态。其支持的 Agent 及接入方式如下:

  • Claude Code:通过命令 hook 和 HTTP 权限 hook 接入,配置简单,启动后自动注册。
  • Codex CLI:通过轮询 JSONL 日志文件实现,无需额外配置。
  • Copilot CLI:通过命令 hook 接入,需手动配置。
  • Gemini CLI:通过命令 hook 接入,启动后自动注册。
  • Cursor Agent:通过 Cursor IDE hook 接入,启动后自动注册。

2. 丰富的状态可视化与动画

Clawd 将 AI 的抽象工作状态转化为直观的像素动画,目前包含 12 种核心状态及多个空闲随机动画:

  • 核心状态:空闲、思考、打字、杂耍、建造、报错、开心、睡觉。
  • 扩展状态:读书、debug 巡逻、指挥(2+ 子代理)、扫地(内存整理)、搬箱子(工作树创建)、通知惊跳等。

3. 核心工作流增强:权限审批气泡

这是 Clawd 改变开发者工作流的关键功能。当 Claude Code 请求权限时,Clawd 会在桌面直接弹出毛玻璃风格的通知卡片,开发者无需切回终端即可操作:

  • 一键审批:支持 Allow(允许)、Deny(拒绝)或建议规则。
  • 规则设定:可设定如“始终允许 Read”等自动化规则。
  • 快捷键支持:支持 Ctrl+Shift+Y 允许、Ctrl+Shift+N 拒绝。
  • 智能管理:支持多请求堆叠显示,若终端先完成回答,气泡自动关闭。

4. 交互体验与彩蛋

  • 眼球追踪:空闲状态下,Clawd 的眼睛会跟随鼠标光标移动,并伴有身体倾斜和影子拉伸效果。
  • 互动反馈:双击可戳一下,连点 4 次触发“抓狂”动画,反复戳击会有不同反应。
  • 拖拽交互:支持从任何状态直接拖拽,利用 Pointer Capture 技术防止拖拽丢失。
  • 迷你模式:拖至屏幕右边缘自动缩小,悬停时探头打招呼,收起状态仍显示迷你通知和庆祝动画。

5. 多会话管理与远程支持

  • 多会话智能:当存在多个会话时,显示最高优先级状态;右键菜单可查看会话列表并跳转至对应终端;自动检测并清理崩溃或退出的 Agent 进程孤儿会话;Clawd 重启时若检测到 Agent 仍在运行,会保持“清醒”状态。
  • Remote SSH 支持:支持一键部署到远程服务器。通过 SSH 反向端口转发,远程服务器上的 Claude Code 和 Codex CLI 事件可穿越隧道回传至本地桌面,实现远程权限审批气泡的本地化显示。

6. 其他功能

  • 免打扰模式:右键进入睡眠状态,静默所有 hook 事件。
  • 音效系统:任务完成和权限请求时播放短音效(可关闭,10秒冷却,DND 模式下自动静音)。
  • 权限模式感知:实时跟踪 Claude Code 的当前权限模式,切换时弹出通知。
  • 自动更新:Windows 使用 NSIS 更新,macOS/Linux 使用 git pull 加自动重启。
  • 国际化 (i18n):支持中英双语,可通过右键菜单切换。
  • 系统托盘:提供调大小(S/M/L)、DND、语言、自启动、检查更新等功能入口。

7. 正在开发的功能

  • 多主题皮肤替换:允许用户自定义角色外观和动画风格。

8. 快速开始

项目开源,支持 Node.js 环境。

git clone https://github.com/rullerzhou-afk/clawd-on-desk.git
cd clawd-on-desk
npm install
npm start

关键要点

  • 解决痛点:解决了 AI 编程助手在终端中状态不透明、开发者需频繁切换窗口确认进度的问题。
  • 广泛兼容:同时支持 Claude Code、Codex CLI、Copilot CLI、Gemini CLI 和 Cursor Agent,且支持多会话并行追踪。
  • 权限审批革新:通过桌面毛玻璃卡片实现 AI 权限请求的一键审批、规则设定和快捷键操作,显著减少上下文切换。
  • 沉浸式交互:提供眼球追踪、多种状态动画(如杂耍、debug 巡逻)、互动彩蛋(抓狂、戳击)及迷你模式,提升桌面交互趣味性。
  • 远程协作支持:通过 SSH 反向端口转发,支持远程服务器上的 AI 事件在本地桌面进行权限审批,扩展了工作流适用范围。
  • 智能会话管理:自动处理孤儿会话、崩溃检测、多会话优先级显示,确保桌面宠物状态的准确性。
  • 开源与社区驱动:项目完全开源,GitHub 获 650+ stars,拥有活跃的贡献者社区,持续迭代新功能(如皮肤系统)。

意义与影响

Clawd on Desk 的出现标志着 AI 辅助开发工具从“功能导向”向“体验导向”的进一步演进。它不仅是一个状态监控工具,更是一种新型的人机交互界面(HMI)探索。

  1. 优化开发者心流:通过视觉化的状态反馈和非侵入式的权限审批,Clawd 减少了开发者在确认 AI 状态和审批权限时的认知负荷和上下文切换成本,有助于维持深度工作状态。
  2. 推动 AI Agent 交互标准化:该项目为不同 AI Agent 提供了统一的桌面交互层,展示了如何通过 Hook 机制和日志轮询等技术手段,将不同厂商的 AI 工具整合进统一的本地工作流中。
  3. 提升 AI 编程的亲和力:通过桌面宠物这一拟人化形式,降低了 AI 工具的冰冷感,增加了使用的趣味性和情感连接,可能促进更多开发者接受和使用 AI 辅助编程。
  4. 开源社区的协作典范:项目从解决个人痛点出发,迅速成长为拥有多贡献者、多 Agent 支持的成熟项目,体现了开源社区在快速迭代和创新方面的强大生命力。

随着 AI Agent 在软件开发中的角色日益重要,此类关注“人与 AI 协作界面”的工具将具有更大的市场潜力和社会价值。Clawd on Desk 为未来的 AI 桌面助手提供了有价值的参考范式。

查看原文 →linux.do