技术博客Hugging Face Blog·1 小时前

NeuroBait：微调模型以刺激ADHD大脑多巴胺分泌

原标题：NeuroBait: I fine-tuned a model to spark dopamine for ADHD brain

速览

NeuroBait是一项利用微调模型来刺激ADHD（注意力缺陷多动障碍）患者大脑多巴胺分泌的技术尝试。该研究旨在通过神经反馈或算法干预，帮助患者改善注意力集中能力。这一进展为ADHD的非药物干预手段提供了新的技术路径和科学依据。

AI 深度解读

NeuroBait：微调模型以激发多巴胺，为 ADHD 大脑提供“启动”火花

背景

ADHD（注意缺陷多动障碍）是一种常见的神经发育障碍，它影响着大脑处理信息、调节注意力以及控制冲动的方式。

作者的妻子患有 ADHD。作者观察到，她常常站在堆积如山的衣物前，明明清楚该做什么，却无法开始行动。这种状态并非懒惰，而是“冻结”（freeze）。对于 ADHD 大脑而言，问题从来不是“不知道做什么”，而是“知道”与“开始”之间的那道鸿沟。

现有的大多数 ADHD AI 工具都误解了这一点。它们侧重于诊断和理论：提供测验、清单、整洁的待办事项列表。然而，对于一个处于“冻结”状态的人来说，待办事项列表只是增加了更多需要选择的选项，再加上一个微弱却令人沮丧的声音说“再努力一点”。这种建议虽然正确，但完全无用。

因此，作者尝试了一种不同的方法。他将理论（执行功能障碍、任务启动瘫痪、基于兴趣的神经系统——即 DSM 临床框架与《分心女王》理念的结合）与研究中罕见的元素进行对照测试：对身边人的真实观察和实践。真正能让妻子从“冻结”中解脱出来的不是计划，而是一点“火花”。

NeuroBait 不生成待办事项列表，它通过激发多巴胺，让“开始”变得可能。

核心内容

NeuroBait 的设计理念是：当你陷入停滞时，它会从你的对话中读取关键信息（如真正的截止日期、你在乎的人或事物），并用 3 到 6 句温暖、自然流畅的句子回答（没有临床标签，没有 bullet point 堆砌）。它理解你为何卡住，将你重新连接到你喜欢的事物上，并交给你一个现在就能做的微小行动。例如：“从堆顶拿下一件衬衫。就一件。”

这里没有内疚感，没有说教。你是主动的英雄，而不是患者。

模型训练细节

这是一个在真实预算下训练的真实模型：

基础模型 (Base)：google/gemma-3-12b-it（密集型的 Gemma 3 12B，使用标准的 Gemma3ForConditionalGeneration，选择它是为了利用可靠的 transformers + peft 部署方案）。
微调方法 (Method)：使用 Unsloth 进行 16-bit LoRA 微调，而非 QLoRA。
LoRA 参数：r=16, alpha=16, dropout=0。
训练配置：
- Epochs: 3
- Learning Rate (LR): 2e-4
- Batch Size: 1 x grad_accum 8
- Max sequence: 2048
Chat Template：使用 gemma-3 模板，响应标记为 <start_of_turn>user\n 和 <start_of_turn>model\n。
保存策略：save_strategy="no"，以避免已知的 Unsloth/TRL checkpoint pickle bug。
训练环境：在 modal.com 上使用 H100 80GB GPU 进行训练。
数据集：小规模、手工筛选、合成数据。数据基于真实的 ADHD 摩擦场景构建，而非通用的生产力陈词滥调。作者学到的教训是：对于语音/对话风格而言，数据集质量优于模型规模。
部署 (Deploy)：部署在 Hugging Face Space 上，使用 ZeroGPU (zero-a10g)，基于 Gradio + 标准 transformers + peft。基础模型以 4-bit bitsandbytes NF4 格式加载，并在运行时应用 LoRA 适配器。运行时不使用 Unsloth，也没有 GGUF 部署路径。

微调前后的行为差异

基础模型并不笨，它很有能力。但开箱即用，它仍然会为你生成待办事项列表，只不过是一个听起来更具同理心的列表：加粗的标题、项目符号、泄露的标签、长段落。对于一个“冻结”的大脑来说，这堵“帮助”之墙本身就是一种过载。

微调后的模型在性质上有所不同。它摒弃了结构，用温暖、流畅的散文风格说话。它变得更简短。它在假设之前先询问。它将你的上下文线索回传给你，使其感觉是为你量身定制的，而不是为通用的“不知所措的用户”准备的。它学会了“语气”，而不是“脚本”。

超越 ADHD 的普适性

令作者惊讶的是，这不仅仅是一个 ADHD 工具。

我们所有人现在都会遇到那堵墙：通过无限滚动（doom-scrolling）陷入麻木，被臃肿的信息流压得喘不过气，无法开始最简单的事情。NeuroBait 的设计初衷就是温暖的。它作为“多巴胺放松”工具，适用于任何被过载感淹没的人，提供温和的、人性化的推动，让人回归到一个小而可行的行动中。ADHD 大脑只是对此需求最大。

这个项目始于作者的 backyard，为一个人服务。希望它能扩展到所有 ADHD 患者，以及任何曾经感到停滞不前的人。

未来计划

下一步将开放权重和完整管道，支持双语（印尼语和英语），最重要的是，与社区共同构建，而非为社区构建。ADHD 工具长期以来一直由没有 ADHD 的人设计。真实的场景、真实的反应、真实的反馈才是该项目的核心。

如果你患有 ADHD，爱着患有 ADHD 的人，或者只是经常感到不知所措，欢迎尝试并告诉作者哪里让人恼火。这种反馈正是整个项目的意义所在。

关键要点

痛点洞察：ADHD 的核心困境在于“任务启动瘫痪”，而非缺乏知识或意愿。传统的待办事项列表对处于“冻结”状态的用户无效，甚至有害。
解决方案：NeuroBait 不生成结构化列表，而是通过激发多巴胺，提供简短、温暖、非临床化的自然语言回应，引导用户迈出微小的一步。
技术栈：
- 基座模型：google/gemma-3-12b-it。
- 微调技术：基于 Unsloth 的 16-bit LoRA (r=16, alpha=16)。
- 训练资源：Modal.com H100 80GB GPU。
- 部署方式：Hugging Face Space (ZeroGPU)，4-bit NF4 量化加载，运行时应用 LoRA。
数据哲学：在对话风格微调中，高质量的小规模合成数据集比大规模通用数据更重要。
普适价值：虽然针对 ADHD 设计，但其“温和推动”和“多巴胺放松”机制也适用于所有感到信息过载或行动力不足的大众用户。
社区驱动：项目强调由 ADHD 群体参与构建，未来将开放权重并支持多语言，重视真实反馈而非单向输出。

意义与影响

NeuroBait 的出现标志着 AI 辅助工具从“信息整理”向“情感与认知支持”的转变。大多数生产力 AI 工具假设用户的问题是“管理不善”，因此提供结构化解决方案。然而，NeuroBait 承认了神经多样性（Neurodiversity）下的执行功能障碍，提供了更具同理心、更人性化的交互范式。

它证明了在资源有限的情况下（小规模数据、特定硬件配置），通过精心设计的提示工程和微调，可以显著改变模型的行为模式，使其从“冷冰冰的效率机器”转变为“温暖的伙伴”。这不仅对 ADHD 群体具有直接帮助，也为更广泛的心理健康支持和认知辅助 AI 提供了新的设计思路：有时候，最好的帮助不是更多的计划，而是一句温暖的“开始吧，只做一点点”。

查看原文 →huggingface.co