开发者自制AI参谋工具适配L站,投票决定是否开源
速览
一位开发者针对多屏工作痛点,利用Claude Code构建了一套个人AI参谋系统。该系统具备任务进度追踪、本地知识库问答、多平台内容抓取及定时任务自动化等功能,并特别适配了L站等级区的浏览器数据复用。由于功能与OpenClaw等现有产品高度重合,作者正通过社区投票决定是否将其开源。
AI 深度解读
背景
作者是一名重度多屏工作者,通常同时使用5个显示屏并行处理多个任务。由于人类注意力资源有限,无法同时监控所有屏幕,作者此前采用了一种基于消息提醒的工具(结合 cc、codex、opencode、gemini 等),当某个任务完成时,通过飞书发送通知,从而无需时刻盯着屏幕。
然而,这种工作流存在显著的痛点:当作者将注意力集中在某一屏幕或任务上时,若其他屏幕的任务完成并发送通知,作者切换回该任务时往往需要花费数分钟重新梳理上下文,导致效率降低。此外,作者长期依赖微信“文件传输助手”作为非结构化的知识库,用于存储视频链接、网页链接及简短注释。这种方式虽然便于关键词搜索,但随着内容堆积,助手变得杂乱无章,且存储的仅是“链接”而非“知识”,缺乏深度处理能力。
为了解决注意力切换成本高和知识管理碎片化的问题,作者基于 Claude Code 构建了一套个人 AI 参谋系统。该系统利用伪终端桥接飞书,实现了在手机端与 Claude Code 的交互,并针对 L 站(Linux DO)等论坛的等级区访问限制进行了特殊适配。
核心内容
作者开发了一套基于 Claude Code 核心的个人 AI 工作流系统,旨在替代传统的多屏监控和微信文件传输助手。该系统通过伪终端技术桥接飞书,使得用户可以在移动端与本地运行的 Claude Code 进行对话。系统核心功能包括:
-
本地知识库与图谱可视化: 系统不仅存储数据,还构建本地知识库并支持图谱可视化(额外安装 Obsidian 进行展示)。用户通过聊天添加内容,机器人可对存储的知识进行准确问答,实现了从“存链接”到“存知识”的转变。
-
智能代办与任务追踪: 用户可通过聊天界面添加代办事项,系统支持实时标记任务进度并持续追踪。更重要的是,系统具备上下文感知能力,当用户切换任务时,可直接向 AI 询问当前屏幕的任务状态和进度,无需手动回忆或查阅上下文。
-
多源内容抓取与入库: 用户可通过聊天发送任意浏览器可打开的链接(包括 L 站链接),系统利用浏览器 MCP(Model Context Protocol)执行内容抓取。特别针对 L 站等论坛,系统复用了用户浏览器的登录数据和 Cookie,因此用户拥有几级账号权限,系统即可抓取对应等级区的内容,解决了 API 访问限制问题。
-
视频内容总结: 支持发送抖音等平台的视频链接,系统自动进行视频内容总结,并将总结结果存入知识库,方便后续检索和问答。
-
自动化定时任务管理: 当对话中涉及定时需求时,系统会自动编写定时任务脚本。例如,用户要求“每天八点发当地天气预报”,系统会创建长期脚本;若要求“30分钟后提醒喝水”,系统会创建临时脚本,并在任务执行完毕后自动删除脚本,保持环境整洁。
-
代码编写与控制: 由于底层复用 Claude Code,该系统本质上是一个开机自启的 Claude Code 实例。用户可直接通过聊天下达开发指令,控制电脑进行代码编写和任务执行。
-
二次确认机制: 在将抓取或总结的内容写入知识库前,系统会进行二次确认,确保数据的准确性和用户控制权。
关键要点
- 技术架构:基于 Claude Code 核心,通过伪终端(Pseudo-terminal)桥接飞书,实现移动端与本地 AI 代理的交互。
- 权限复用:利用浏览器 MCP 复用本地浏览器的 Cookie 和登录状态,从而绕过论坛(如 L 站)的等级访问限制,实现全量内容抓取。
- 知识形态升级:从微信文件传输助手的“链接+注释”模式,升级为“结构化知识+图谱”模式,支持直接问答而非仅关键词搜索。
- 注意力管理:通过实时任务进度追踪和上下文问答,解决多任务切换时的认知负荷问题。
- 自动化闭环:具备自动编写、执行和清理定时脚本的能力,实现了轻量级的自动化工作流。
- 去臃肿设计:相比 OpenClaw 或 QClaw 等通用框架,该系统抛弃了复杂的记忆系统等非必要功能,完全从个人实际需求出发,保持轻量高效。
- 开源争议:作者因功能与现有产品(如 OpenClaw、QClaw)高度重合且针对特定社区(L 站)做了适配,正在社区投票决定是否开源。
意义与影响
这一案例展示了个人 AI 工作流从“被动接收通知”向“主动知识管理与任务协同”演进的趋势。
首先,它揭示了**本地大模型代理(Local AI Agent)**在解决特定工作流痛点上的巨大潜力。通过复用 Claude Code 等成熟框架,个人开发者可以低成本构建出具备代码执行、浏览器控制和知识管理能力的私人助理,而无需从零搭建复杂架构。
其次,浏览器 MCP 的应用为解决 Web 数据获取的权限壁垒提供了巧妙思路。通过复用用户浏览器的会话状态,AI 代理能够以“用户身份”访问受限内容,这在当前 API 接口受限或付费墙普遍的环境下,具有极高的实用价值。
最后,该案例引发了关于开源与私有定制的讨论。虽然功能上与 OpenClaw 等开源项目存在重叠,但作者强调其“从需求出发”的极简主义设计。这提示我们,在 AI 应用层,通用框架往往过于臃肿,而基于个人真实场景打磨的“小而美”工作流,可能在特定领域提供比通用产品更优的体验。无论是否开源,这种以解决具体痛点为核心的开发思路,为 AI 辅助编程和个人效率工具的开发提供了新的参考范式。
