开源口袋AI助理:基于Claude Code深度适配飞书与L站
速览
PocketAide是一个开源的个人AI助理项目,核心原理是在本地伪终端运行Claude Code并连接飞书。它针对L站和抖音进行了专项适配,支持通过语义向量、关系图谱和全文检索构建本地知识库。此外,项目实现了任务追踪、网页全链路抓取及抖音视频转写总结功能,旨在替代传统收藏夹脚本,实现高效的信息管理与自动化工作流。
AI 深度解读
深度解读:PocketAide —— 基于 Claude Code 的“需求驱动型”个人 AI 助理
背景
在 AI 工具日益丰富的当下,许多开源项目(如 OpenClaw)往往陷入“先有工具,再找场景”的困境。开发者构建了一个功能强大的 Agent 框架,但用户拿到后往往不知如何将其转化为实际的生产力,导致工具闲置或仅作为玩具使用。
在此背景下,LINUX DO 社区用户 huanchong-99 开发了 PocketAide(口袋 AI 助理)。该项目并非从零构建复杂的 Agent 架构,而是基于 Claude Code 这一强大的终端开发工具,通过“桥接”技术将其能力延伸至飞书(Feishu/Lark)聊天界面。
PocketAide 的核心理念是“需求驱动”:它最初是为了解决 LINUX DO(L站)用户管理帖子收藏、追踪多任务进度以及整理本地知识的具体痛点而诞生的。它本质上是一个“瘦身版”的 OpenClaw,剔除了冗余功能,专注于任务追踪、本地知识库构建、网页内容抓取及总结等高频场景,旨在彻底替代传统的 L站收藏夹油猴脚本,并为用户提供一种更智能、更结构化的信息处理方式。
核心内容
PocketAide 是一个运行在用户本地电脑上的个人 AI 秘书,它通过伪终端(Pseudo-Terminal)运行 Claude Code,并将终端交互状态通过桥接器同步至飞书。其核心功能模块包括:
1. 本地知识库与知识图谱
系统提供了一个三路混合检索系统,支持语义向量检索、关系图谱和全文检索。
- 技术实现:由
tools/kg/目录下的kg.py、embedder.py和embed_daemon.py提供支持。 - 定位:这是一个面向个人的轻量级知识库构建方案,而非涉及实体抽取、本体构建或自动推理的企业级知识图谱。
- 同步建议:建议将本地工作区上传至 GitHub 私密仓库以实现云同步,并可结合 Obsidian 进行可视化展示。
2. 任务追踪与进度管理
用户可通过飞书对话添加待办事项(To-Do),系统会自动追踪每个任务的进展。
- 多任务并行:适合多显示器、多任务并行的工作流。用户可实时同步各任务的进度节点,系统会自动归档已完成的任务。
- 记忆回溯:当用户忘记任务细节时,可通过问答直接检索历史进度记录,起到“外部记忆”的作用。
3. L站特殊适配:网页抓取与智能收藏
这是该项目最具特色的功能,旨在彻底替代传统的 L站收藏夹油猴脚本。
- 复用真实数据:通过脚本调试模式启动 Chrome 浏览器,利用浏览器 MCP(Model Context Protocol)连接,复用用户已登录的真实 Cookie 和数据。这意味着它能访问用户有权限查看的所有等级区内容。
- 全链路抓取:用户只需在飞书发送帖子链接,系统即可自动抓取帖子正文及评论区内容。
- 智能处理:抓取后可进行总结精炼,用户可在对话中二次确认或修改,最终存入知识库。相比传统收藏夹仅能搜索标题,PocketAide 支持基于内容全文的精准检索。
4. 抖音视频总结与入库
针对短视频内容,系统提供自动转写与总结功能。
- 工作流:用户发送抖音链接 -> 系统复用浏览器连接豆包网页版 -> 自动输入提示词要求转写 -> 复制纯文字稿 -> 根据用户指令(总结或原文)处理 -> 存入知识库。
- 前置条件:用户需先在本地浏览器登录豆包网页版,并将模式从“快速”切换为“任务模式”。
5. 代码任务辅助
支持通过飞书指挥 Claude Code 或 Codex 完成其他项目的开发任务。目前该功能尚在优化中,主要作为开发者的辅助手段。
6. 飞书交互优化机制
为了解决飞书卡片变动不发送消息提醒的问题,系统采用了一种巧妙的“欺骗”机制:
- 任务开始时,发送“正在思考中”卡片。
- 任务完成后,发送一条“任务已完成”的文字消息,并在 40 秒后自动撤回。
- 目的:利用文字消息触发手机端的推送通知,确保用户不会遗漏任务完成的状态,同时避免消息列表被污染。
关键要点
- 架构哲学:不重复造轮子,直接复用 Claude Code 作为核心引擎,通过桥接层将其能力适配到飞书环境。这是一种“先有需求,再做开发”的产品思路。
- 技术栈:
- 核心引擎:Claude Code(需 Claude Max 订阅,非按 Token 付费 API)。
- 桥接层:Node.js (
node-pty构建伪终端),连接飞书 WebSocket。 - 知识库:Python (
bge-m3模型进行向量化),支持本地索引。 - 浏览器自动化:复用本地 Chrome 实例,通过 MCP 协议连接。
- 部署环境:主要支持 Windows 10/11(依赖 ConPTY, PowerShell 5.1, Windows Task Scheduler),同时也兼容 Linux/macOS 的基本逻辑,但配置教程主要针对 Windows。
- 配置流程:
- 安装 Node.js (20+), Python (3.11+), Git, Claude CLI。
- 配置飞书自建应用(开启长连接模式),获取 App ID/Secret 和 Owner Open ID。
- 安装依赖并构建知识库索引(下载约 2.2GB 的 bge-m3 模型)。
- 通过向 AI 助手发送特定的 Prompt 脚本,自动化完成环境检测与配置。
- 可扩展性:项目本质上是 Claude Code 的 Skill 集合。用户可参考社区教程创建自定义 Skill,扩展其功能边界。
意义与影响
PocketAide 的出现为个人 AI 助手的应用提供了新的范式,其意义体现在以下几个方面:
-
从“玩具”到“工具”的转变: 许多 AI Agent 项目止步于演示,而 PocketAide 展示了如何将大模型能力嵌入到具体的、高频的个人工作流中(如收藏帖子、追踪任务)。它证明了“场景驱动开发”比“技术堆砌”更能产生实际价值。
-
对传统信息收集方式的颠覆: 通过复用浏览器数据和 MCP 协议,PocketAide 解决了传统收藏夹“只存标题、无法检索内容”的痛点。它将非结构化的网页内容(包括评论区)转化为结构化的知识库条目,极大地提升了信息复用率。
-
降低 AI 使用门槛与成本: 利用 Claude Max 订阅而非按 Token 付费的 API,使得长期运行本地 Agent 的经济成本大幅降低。同时,通过飞书这一通用办公入口,用户无需学习复杂的命令行操作,即可享受 AI 带来的便利。
-
开源社区的协作与启发: 该项目在 LINUX DO 社区发起讨论并开源,体现了开源社区“从需求出发”的协作精神。它不仅提供了一个可用的工具,更提供了一套基于 Claude Code 开发自定义 Skill 的方法论,鼓励用户根据自身需求进行二次开发。
-
技术实现的借鉴意义: 通过
node-pty和 MCP 协议连接本地浏览器,以及利用飞书消息机制解决通知痛点,这些具体的技术实现细节为其他开发者构建本地化 AI 应用提供了宝贵的参考案例。
总之,PocketAide 是一个典型的“小而美”的开源项目,它没有追求大而全的 Agent 框架,而是精准打击用户痛点,通过巧妙的技术整合,实现了个人知识管理与任务追踪的高效闭环。
