DyNote:将抖音视频及评论整理为结构化Markdown笔记
速览
DyNote是一款面向Codex/Agent的开源技能,旨在将抖音视频、评论及账号内容转化为可复用的Markdown学习笔记。它通过quick-pass、evidence-pass和research-pass分层策略,智能平衡信息完整性与Token成本,避免无效转写。项目支持关键帧OCR、评论洞察及账号结构分析,输出包含转写文本、元数据及预算估算,便于导入Obsidian等知识库进行长期归档与复习。
AI 深度解读
背景
在 AI 辅助学习和知识管理的场景中,B 站(Bilibili)因其相对稳定的视频、图文和评论结构,已有成熟的工具如 bili-note 将其转化为可回查证据的 Markdown 学习笔记。然而,抖音(Douyin)的信息生态截然不同:内容更碎片化,关键信息往往隐藏在画面文字、贴纸、商品卡、操作步骤以及长期的账号选题结构中,而非仅仅依赖音频转写。
如果简单地将 bili-note 的逻辑套用于抖音,不仅无法有效提取价值,还会因处理大量低信息密度内容而消耗巨额 Token。为此,开发者推出了 dy-note,这是一个专为 Codex / Agent 设计的 Skill,旨在解决抖音短视频特有的信息提取难题,通过分层处理策略,在保留原始材料、转写、评论样本和元数据的同时,实现低成本、高证据等级的知识归档。
核心内容
dy-note 的核心设计理念并非简单的“平台替换”,而是基于抖音信息结构的特殊性,构建了一套分层证据处理机制和预算控制体系。
1. 分层处理策略
dy-note 根据任务类型和证据需求,将处理流程分为三个层级,以避免 Token 浪费并确保结论可靠性:
- Quick-pass(快速通过):适用于快速理解、选题筛选或生成草稿。利用页面元数据、抖音网页 AI 摘要或已有摘要,但会明确标注证据等级,不将快读结果伪装成完整字幕。
- Evidence-pass(证据通过):适用于学习笔记、脚本拆解、引用原文或事实核查。优先调用字幕轨、本地 ASR、关键帧 OCR 和评论样本,确保结论有坚实的材料支撑。
- Research-pass(研究通过):适用于账号分析、话题研究、竞品观察和批量样本收集。先以低成本收集样本,再决定哪些视频值得升级处理。
2. 证据分层与复用机制
不同来源的材料具有不同的可信度和适用场景:
- 页面简介/抖音问 AI:适合快读和章节要点,但不能冒充完整字幕。
- 本地 ASR:提供文字主干,但无法读取画面中的贴纸、商品卡等操作细节。
- 关键帧/OCR:补充画面文字信息。
- 评论样本:反映用户需求、反对意见和真实反馈。
dy-note 严格区分这些证据等级,不将低等级材料直接推导为高等级结论。当证据不足时,系统会先记录限制条件,再决定是否升级处理流程。同时,项目具备强大的复用能力:如果本地已存在 douyin_ai_brief.json、transcript.txt、segments.json 或 metadata.json,系统将优先复用,避免重复调用 AI 或运行 ASR。
3. 输出结构与预算控制
dy-note 的输出不是单一的摘要,而是一包可复用的材料,通常包括:
transcript.cleaned.md/transcript.txt:适合阅读或纯文本的转写。segments.json:包含时间轴的结构化转写。metadata.json:来源、作者、作品 ID 等元数据。note_budget.json:根据材料量、转写密度和互动质量估算的笔记长度预算。- 评论 JSON/CSV、关键帧/OCR 数据。
learning_note.md:最终生成的学习笔记。
4. 技术依赖与限制
- ASR 后端:中文视频默认推荐复用 Qwen3-ASR 环境,也可使用 Whisper 系后端。
- 画面信息:必须依赖关键帧、OCR 或抖音网页 AI 来提取画面内的文字信息(如贴纸、商品卡)。
- 登录环境:评论抓取、账号页面分析等场景通常需要当前已登录的浏览器环境。
- 隐私安全:项目不要求导出 Cookie、Token 或本地登录凭据,严禁将这些敏感信息写入日志或文档。
关键要点
- 差异化设计:
dy-note针对抖音信息碎片化、画面依赖度高的特点,设计了不同于 B 站的省 Token 和信息提取策略。 - 证据等级分明:严格区分快读摘要、音频转写、画面 OCR 和评论反馈的证据等级,避免“低质高推”。
- 智能预算控制:通过
note_budget.json动态评估笔记深度,根据材料质量决定处理粒度,防止在低价值内容上过度消耗资源。 - 模块化复用:支持输入产物(如字幕、元数据、AI 摘要)的复用,避免重复计算,提升处理效率。
- 多场景覆盖:不仅支持单视频整理,还涵盖评论区洞察、账号结构分析、话题研究和竞品观察。
- 隐私合规:明确声明不索取 Cookie 或登录凭据,保障用户数据安全。
- 生态互补:与
bili-note形成互补,前者侧重 B 站长视频/课程归档,后者侧重抖音短视频/评论洞察,两者可共享本地 ASR 等基础设施。
意义与影响
dy-note 的出现标志着 AI 笔记工具从“通用转录”向“结构化证据管理”的深化。它解决了短视频领域长期存在的两个痛点:一是短视频信息密度低且分散,盲目转写导致 Token 浪费;二是短视频高度依赖视觉信息,纯音频转写会丢失关键上下文(如操作步骤、商品链接)。
通过引入分层处理和证据分级机制,dy-note 为知识工作者提供了一种更理性、更高效的内容沉淀方式。它不仅仅是一个笔记生成器,更是一个智能的内容过滤器和分析器,帮助用户在海量短视频中快速识别高价值内容,并将其转化为可追溯、可复用的结构化知识资产。这对于构建个人知识库、进行市场竞品分析或学术研究具有重要的实用价值。
