技术博客arXiv cs.CL·3 小时前

在线药物社区中吸毒者自我污名化的认知情感行为表达

原标题：The cognitive, affective, and behavioral expression of self-stigma among people who use drugs in online substance use communities

速览

该研究通过大语言模型分析Reddit上超7万条帖子，开发了涵盖认知、情感和行为领域的自我污名化编码体系。研究发现，自我污名化是一个整合现象，行为指标（如想戒断）往往早于核心指标（如羞耻）出现，且多数表达随时间稳定，但悲观情绪加深。这为早期数字干预提供了新视角，并挑战了传统的渐进式阶段模型。

AI 深度解读

在线药物使用社区中，药物使用者自我污名化的认知、情感与行为表达

背景

在公共卫生和数字健康研究领域，药物使用（substance use）往往伴随着强烈的社会污名化（stigma）。这种外部污名内化为个体的“自我污名化”（self-stigma），不仅加剧心理痛苦，还可能阻碍求助行为。传统的理解通常基于“渐进式阶段模型”（progressive stage models），即认为个体的心理和行为变化是线性发展的：先有认知上的自我否定，随后产生羞耻等情感，最后才表现为回避或戒断等行为。

然而，随着在线社区（如 Reddit）成为药物使用者表达痛苦、寻求支持的重要场所，研究者开始关注这些平台上的自然语言数据。现有的研究多侧重于单一维度的分析，缺乏对自我污名化在认知、情感和行为三个层面的系统性编码，也鲜有研究利用大规模语言模型来验证这些指标在真实网络文本中的分布规律和时间动态。

本研究旨在填补这一空白，通过开发一套涵盖三大领域的自我污名化指标代码本（codebook），并利用大语言模型（LLM）对 Reddit 上长达近二十年的药物使用者帖子进行大规模分析，以揭示自我污名化的真实表达模式及其时间演变规律。

核心内容

研究目标与方法

本研究的主要目标是开发一个涵盖认知、情感和行为的自我污名化指标代码本，并估算这些指标在 Reddit 药物使用者帖子中的流行率、共现情况及时间模式。

1. 代码本开发： 研究团队通过基于共识的归纳编码（consensus-based abductive coding），构建了包含10个指标的代码本，分为三个领域：

认知领域（Cognitive）： 自我标签化（self-labeling）、悲观/自我挫败（pessimism/self-defeatism）、应得性/无价值感（deservingness/worthlessness）。
情感领域（Affective）： 羞耻（shame）、内疚/自责（guilt/self-blame）、绝望/无望（despair/hopelessness）。
行为领域（Behavioral）： 隐瞒（concealment）、预期拒绝（anticipated rejection）、戒断意愿（desire to quit）、矛盾心理（ambivalence）。

两位人工编码员之间达到了实质性一致（Cohen's kappa = 0.72）。

2. 大规模数据验证与分析： 为了扩展分析规模，研究团队使用大语言模型对分类任务进行了扩展，并通过专家编码进行了验证（kappa = 0.73, F1 = 0.80）。最终，研究分析了来自1,660名英语用户（2006-2025年）发布的72,115个主题发起帖（thread-initiating posts）。

主要发现

1. 自我污名化的普遍性与指标区分度：

流行率： 在分析的帖子中，有3,838篇（5.3%）包含自我污名化内容，涉及1,228名用户（74.0%）。
指标区分力： 所有10个指标均能有效区分包含自我污名化的帖子，相对风险比（RR）在3.6到86.2之间。
高频指标： 最常见的指标是“自我标签化”（56.0%）和“绝望/无望”（48.5%）。

2. 自我污名化的整合性（Integration）： 自我污名化并非孤立存在，而是一个高度整合的现象：

核心与行为的强关联： 在用户层面，核心指标（认知/情感）与行为指标之间存在强关联（OR = 4.65, 95% CI 3.12-6.94, p < 0.001）。
共现率高： 87.0% 包含行为指标的帖子同时也包含核心指标。这表明，药物使用者很少仅仅表现出外在行为变化，而往往伴随着内在的心理认同。

3. 时间模式的反直觉发现： 研究结果挑战了传统的渐进式模型：

行为先于核心： 行为指标往往比核心指标出现得更早。例如，“戒断意愿”的中位出现位置为0.08，而“羞耻”的中位出现位置为0.38。这意味着用户可能在完全内化自我污名（如感到羞耻或无价值）之前，就已经表现出回避或寻求改变的行为倾向。
稳定性与变化： 在发帖轨迹中，10个指标中有9个保持相对稳定。唯一显著增加的是“悲观”情绪（OR = 1.62, 95% CI 1.25-2.10），表明随着时间推移，用户对改变现状的信心逐渐降低。

关键要点

多维指标体系： 研究确立了自我污名化的10个具体指标，涵盖认知（如自我标签）、情感（如羞耻）和行为（如隐瞒、戒断意愿）三个维度，为量化分析提供了标准。
LLM的高效应用： 利用经过专家验证的大语言模型，成功从海量非结构化文本中识别出细微的心理和行为信号，证明了LLM在数字心理健康研究中的可行性（F1分数达0.80）。
行为指标的前置性： 与传统理论相反，行为指标（如想戒断）往往早于核心认知/情感指标（如羞耻）出现。这提示在早期干预中，行为信号可能是更敏感的预警指标。
自我污名的高度整合： 行为表达极少脱离内在认知/情感独立存在。87%的行为表达帖子同时包含核心指标，说明外在行为是内在痛苦的综合反映。
悲观情绪的恶化趋势： 尽管大多数自我污名化表达随时间稳定，但“悲观”情绪显著增加。这标志着用户可能在长期社区互动中陷入更深的无力感，是数字干预的关键靶点。
渐进模型的局限性： 研究结果不支持简单的线性渐进模型，表明在线文本披露中的心理过程更为复杂和动态，不能简单套用传统的阶段理论。

意义与影响

1. 对数字心理健康干预的启示： 研究指出，“悲观”情绪随时间加深，且行为指标常早于核心情感指标出现。这为早期数字干预提供了明确方向：监测平台上的行为信号（如表达戒断意愿或隐瞒行为）可能比等待用户表达羞耻或无价值感更早发现高风险个体。针对悲观情绪的干预措施可能有助于阻断自我污名化的恶化。

2. 方法论贡献： 本研究展示了如何结合人工编码的严谨性与大语言模型的扩展性，处理复杂的心理社会概念。通过验证LLM在识别自我污名化指标上的有效性，为未来大规模研究在线心理健康数据提供了可复用的方法论框架。

3. 理论修正： 研究结果对现有的“渐进式阶段模型”提出了挑战。它表明，在在线社区的文本披露中，行为改变的动力可能先于内在态度的完全转变。这要求临床心理学家和公共卫生专家重新思考药物使用者的求助路径，认识到行为层面的“矛盾”或“尝试改变”可能是介入的关键窗口期，而非仅仅是认知或情感成熟后的结果。

4. 减少污名化的策略： 通过量化自我污名化的具体表达，研究有助于识别哪些类型的语言和内容最容易引发或加剧用户的自我否定。在线社区管理者和内容创作者可以据此优化社区指南，减少触发自我标签化和无价值感的语言环境，从而在数字空间中构建更支持性的氛围。

查看原文 →arxiv.org