Bili Note:开源Skill将B站视频转为可追问Markdown笔记
原标题:Bili Note:把 B 站视频和图文整理成可追问的 Markdown 笔记
速览
Bili Note是一款面向Codex/Agent的开源Skill,旨在将B站视频、图文及动态内容整理为结构化的Markdown笔记。其核心优势在于保留完整原始材料、字幕及元数据,并生成论文式证据索引,支持后续追问。该工具通过动态评估内容信息量决定笔记篇幅,避免过度压缩或扩写,适合将B站内容沉淀至Obsidian等知识库。
AI 深度解读
背景
在数字化学习与技术获取的过程中,B站(Bilibili)已成为大量开发者、科研人员及AI爱好者获取知识的重要平台。然而,传统的视频观看体验存在明显的“知识沉淀”痛点:视频内容往往以线性流媒体形式存在,难以直接转化为结构化的个人知识库。
许多用户面临以下困境:
- 信息过载与压缩失真:无论是5分钟的短视频还是70分钟的深度课程,传统的AI摘要工具往往将其压缩为篇幅相近的摘要,导致长视频核心细节丢失,或短视频被过度扩写而显得冗余。
- 缺乏可追问性:生成的摘要通常是封闭的文本块,无法支持后续的深度交互或基于原文证据的溯源。
- 多模态数据割裂:视频字幕、图文正文、评论区的高质量技术讨论、元数据(点赞、弹幕、发布时间)等分散在不同模块,难以统一归档。
在此背景下,开源项目 Bili Note 应运而生。该项目由 LINUX DO 社区用户开发,旨在为 Codex 等 AI Agent 提供一个 Skill(技能),将 B 站视频、图文及动态内容转化为可追问、可溯源、结构化的 Markdown 笔记,从而打通从“观看”到“知识内化”的最后一步。
核心内容
Bili Note 是一个面向 AI Agent(如 Codex)的工具型 Skill,其核心功能是将 B 站的非结构化多媒体内容转化为结构化的本地 Markdown 笔记。它不仅仅是一个摘要生成器,更是一个完整的内容归档与知识提取系统。
1. 功能范围
- 多内容类型支持:支持提取 B 站视频、图文(Opus)、动态长文。
- 多模态数据归档:不仅提取文本,还完整保存完整字幕、图文正文、图片、评论、元数据(如点赞、收藏、发布时间)以及证据索引。
- 评论区挖掘:可选提取评论区中具有技术价值的讨论内容,丰富笔记的知识维度。
- 自动化归档:支持将生成的笔记保存至指定本地文件夹或集成至 Obsidian 等知识库软件。
2. 核心设计理念:动态“笔记预算”
Bili Note 区别于传统固定长度总结器的关键,在于其引入了“笔记预算”机制。
- 动态评估:系统首先分析原始材料的规模,包括视频时长、字幕字数、证据块数量、互动质量(点赞/评论比)等信号。
- 自适应生成:基于上述信号,动态决定笔记的详细程度。
- 长课程:不会被强行压缩成简短摘要,而是保留足够的细节以支持复习。
- 短视频:不会被硬扩写成冗长论文,保持精炼。
- 证据索引:生成的笔记采用类似学术论文的引用格式(如
[1][2]),将关键判断与原文证据链接,确保内容的可验证性。
3. 技术实现与依赖
- 核心路径:主要依赖 B 站公开接口,用于获取元数据、公开字幕、图文及评论。这种设计保证了核心功能的轻量级和稳定性。
- 增强路径(字幕兜底):
- 若视频无公开字幕,尝试通过 Chrome + Web Access 获取网页端 AI 字幕。
- 若仍无字幕,支持本地 ASR(自动语音识别)转写,需后端支持
ffmpeg及Whisper/faster-whisper/FunASR等模型。
- Agent 集成:通过自然语言指令与 Codex 交互,例如“请帮我安装这个 skill”、“请帮我提取这个视频的内容”或“帮我存放在指定路径”。
关键要点
- 非摘要,而是知识库材料:Bili Note 的目标不是生成几句总结,而是生成一份适合放入 Obsidian、支持后续 Agent 继续问答的知识库材料。
- 保留原始完整性:强调保留完整原始材料(字幕、正文、图片),以便用户后续进行深度追问,而非一次性消费内容。
- 动态长度控制:通过“笔记预算”机制,根据内容信息量和互动质量动态调整笔记长度,解决“长短不一”导致的总结失真问题。
- 可溯源性:通过
[1][2]式的证据索引,让笔记中的关键结论都能回查至原文证据,提升可信度。 - 轻量依赖与灵活扩展:核心功能尽量轻依赖 B 站公开接口,字幕获取提供从云端 AI 到本地 ASR 的多层兜底方案,平衡了易用性与覆盖率。
- 开源与社区驱动:项目完全开源,无未开源部分,并在 LINUX DO 社区获得推广,接受社区监督与贡献。
意义与影响
Bili Note 的出现反映了 AI 应用从“内容消费”向“知识管理”深化的趋势。
- 填补了 B 站内容与个人知识库之间的空白:对于 AI、编程、科研等领域的学习者而言,B 站是重要的知识源,但缺乏高效的工具将其转化为可检索、可关联的个人知识资产。Bili Note 提供了标准化的解决方案。
- 提升了 AI Agent 的工作流效率:通过将非结构化视频/图文转化为结构化的 Markdown 并附带证据索引,使得后续的 Agent 问答、复习和知识整合更加精准和高效。
- 推动了“可追问”式学习的普及:传统的笔记往往是静态的,而 Bili Note 生成的笔记支持后续追问,符合人类深度学习和探究的认知规律。
- 开源生态的积极实践:该项目在 LINUX DO 社区的规范推广,展示了开源项目在解决特定垂直领域痛点时的活力,也为其他类似工具的开发提供了参考范式(如动态预算机制、多层字幕兜底策略)。
总之,Bili Note 不仅是一个工具,更是一种将碎片化视频内容系统化、结构化、可交互化的知识管理方法论的体现。
查看原文 →linux.do
