NeuroBait:微调模型以刺激ADHD大脑多巴胺分泌
速览
NeuroBait是一项利用微调模型来刺激ADHD(注意力缺陷多动障碍)患者大脑多巴胺分泌的技术尝试。该研究旨在通过神经反馈或算法干预,帮助患者改善注意力集中能力。这一进展为ADHD的非药物干预手段提供了新的技术路径和科学依据。
AI 深度解读
NeuroBait:微调模型以激发多巴胺,为 ADHD 大脑提供“启动”火花
背景
ADHD(注意缺陷多动障碍)是一种常见的神经发育障碍,它影响着大脑处理信息、调节注意力以及控制冲动的方式。
作者的妻子患有 ADHD。作者观察到,她常常站在堆积如山的衣物前,明明清楚该做什么,却无法开始行动。这种状态并非懒惰,而是“冻结”(freeze)。对于 ADHD 大脑而言,问题从来不是“不知道做什么”,而是“知道”与“开始”之间的那道鸿沟。
现有的大多数 ADHD AI 工具都误解了这一点。它们侧重于诊断和理论:提供测验、清单、整洁的待办事项列表。然而,对于一个处于“冻结”状态的人来说,待办事项列表只是增加了更多需要选择的选项,再加上一个微弱却令人沮丧的声音说“再努力一点”。这种建议虽然正确,但完全无用。
因此,作者尝试了一种不同的方法。他将理论(执行功能障碍、任务启动瘫痪、基于兴趣的神经系统——即 DSM 临床框架与《分心女王》理念的结合)与研究中罕见的元素进行对照测试:对身边人的真实观察和实践。真正能让妻子从“冻结”中解脱出来的不是计划,而是一点“火花”。
NeuroBait 不生成待办事项列表,它通过激发多巴胺,让“开始”变得可能。
核心内容
NeuroBait 的设计理念是:当你陷入停滞时,它会从你的对话中读取关键信息(如真正的截止日期、你在乎的人或事物),并用 3 到 6 句温暖、自然流畅的句子回答(没有临床标签,没有 bullet point 堆砌)。它理解你为何卡住,将你重新连接到你喜欢的事物上,并交给你一个现在就能做的微小行动。例如:“从堆顶拿下一件衬衫。就一件。”
这里没有内疚感,没有说教。你是主动的英雄,而不是患者。
模型训练细节
这是一个在真实预算下训练的真实模型:
- 基础模型 (Base):
google/gemma-3-12b-it(密集型的 Gemma 3 12B,使用标准的Gemma3ForConditionalGeneration,选择它是为了利用可靠的 transformers + peft 部署方案)。 - 微调方法 (Method):使用 Unsloth 进行 16-bit LoRA 微调,而非 QLoRA。
- LoRA 参数:
r=16,alpha=16,dropout=0。 - 训练配置:
- Epochs: 3
- Learning Rate (LR): 2e-4
- Batch Size: 1 x grad_accum 8
- Max sequence: 2048
- Chat Template:使用
gemma-3模板,响应标记为<start_of_turn>user\n和<start_of_turn>model\n。 - 保存策略:
save_strategy="no",以避免已知的 Unsloth/TRL checkpoint pickle bug。 - 训练环境:在
modal.com上使用 H100 80GB GPU 进行训练。 - 数据集:小规模、手工筛选、合成数据。数据基于真实的 ADHD 摩擦场景构建,而非通用的生产力陈词滥调。作者学到的教训是:对于语音/对话风格而言,数据集质量优于模型规模。
- 部署 (Deploy):部署在 Hugging Face Space 上,使用 ZeroGPU (zero-a10g),基于 Gradio + 标准 transformers + peft。基础模型以 4-bit
bitsandbytesNF4 格式加载,并在运行时应用 LoRA 适配器。运行时不使用 Unsloth,也没有 GGUF 部署路径。
微调前后的行为差异
基础模型并不笨,它很有能力。但开箱即用,它仍然会为你生成待办事项列表,只不过是一个听起来更具同理心的列表:加粗的标题、项目符号、泄露的标签、长段落。对于一个“冻结”的大脑来说,这堵“帮助”之墙本身就是一种过载。
微调后的模型在性质上有所不同。它摒弃了结构,用温暖、流畅的散文风格说话。它变得更简短。它在假设之前先询问。它将你的上下文线索回传给你,使其感觉是为你量身定制的,而不是为通用的“不知所措的用户”准备的。它学会了“语气”,而不是“脚本”。
超越 ADHD 的普适性
令作者惊讶的是,这不仅仅是一个 ADHD 工具。
我们所有人现在都会遇到那堵墙:通过无限滚动(doom-scrolling)陷入麻木,被臃肿的信息流压得喘不过气,无法开始最简单的事情。NeuroBait 的设计初衷就是温暖的。它作为“多巴胺放松”工具,适用于任何被过载感淹没的人,提供温和的、人性化的推动,让人回归到一个小而可行的行动中。ADHD 大脑只是对此需求最大。
这个项目始于作者的 backyard,为一个人服务。希望它能扩展到所有 ADHD 患者,以及任何曾经感到停滞不前的人。
未来计划
下一步将开放权重和完整管道,支持双语(印尼语和英语),最重要的是,与社区共同构建,而非为社区构建。ADHD 工具长期以来一直由没有 ADHD 的人设计。真实的场景、真实的反应、真实的反馈才是该项目的核心。
如果你患有 ADHD,爱着患有 ADHD 的人,或者只是经常感到不知所措,欢迎尝试并告诉作者哪里让人恼火。这种反馈正是整个项目的意义所在。
关键要点
- 痛点洞察:ADHD 的核心困境在于“任务启动瘫痪”,而非缺乏知识或意愿。传统的待办事项列表对处于“冻结”状态的用户无效,甚至有害。
- 解决方案:NeuroBait 不生成结构化列表,而是通过激发多巴胺,提供简短、温暖、非临床化的自然语言回应,引导用户迈出微小的一步。
- 技术栈:
- 基座模型:
google/gemma-3-12b-it。 - 微调技术:基于 Unsloth 的 16-bit LoRA (
r=16, alpha=16)。 - 训练资源:Modal.com H100 80GB GPU。
- 部署方式:Hugging Face Space (ZeroGPU),4-bit NF4 量化加载,运行时应用 LoRA。
- 基座模型:
- 数据哲学:在对话风格微调中,高质量的小规模合成数据集比大规模通用数据更重要。
- 普适价值:虽然针对 ADHD 设计,但其“温和推动”和“多巴胺放松”机制也适用于所有感到信息过载或行动力不足的大众用户。
- 社区驱动:项目强调由 ADHD 群体参与构建,未来将开放权重并支持多语言,重视真实反馈而非单向输出。
意义与影响
NeuroBait 的出现标志着 AI 辅助工具从“信息整理”向“情感与认知支持”的转变。大多数生产力 AI 工具假设用户的问题是“管理不善”,因此提供结构化解决方案。然而,NeuroBait 承认了神经多样性(Neurodiversity)下的执行功能障碍,提供了更具同理心、更人性化的交互范式。
它证明了在资源有限的情况下(小规模数据、特定硬件配置),通过精心设计的提示工程和微调,可以显著改变模型的行为模式,使其从“冷冰冰的效率机器”转变为“温暖的伙伴”。这不仅对 ADHD 群体具有直接帮助,也为更广泛的心理健康支持和认知辅助 AI 提供了新的设计思路:有时候,最好的帮助不是更多的计划,而是一句温暖的“开始吧,只做一点点”。
