技术博客arXiv cs.CL·7 天前

超越静态分类的青年危机对话关键词生成表示法

原标题：Keyphrase Generative Representation of Youth Crisis Conversations Beyond Static Taxonomies

速览

研究分析近70万条青少年危机对话，将原有19类标签扩展为39类层级架构。引入关键词生成表示法（KGR），通过约束LLM生成对话特定的关键词，显著提升了内容准确性与清晰度。该方法揭示了静态分类无法捕捉的身份关联主题，并将主题检索准确率从0.25提升至0.70，为危机响应提供了更具可解释性的混合生成表示方案。

AI 深度解读

Keyphrase Generative Representation of Youth Crisis Conversations Beyond Static Taxonomies

背景

在青少年心理健康危机干预领域，危机响应人员（Crisis Responders, CRs）每年需要快速评估数千条青少年发送的短信对话，以识别潜在的心理健康问题并提供相应的支持指导。然而，传统的危机干预体系往往依赖于固定的标签分类体系（Fixed-label Taxonomies）。

随着语言习惯的演变，青少年表达痛苦和 distress（痛苦/困扰）的方式日益多样化、语境化且动态变化。这种新兴的、特定语境下的语言表达往往无法被传统的静态分类标签所涵盖，导致许多真实的心理危机信号被遗漏或误判。现有的静态分类法在面对复杂、非标准化的青少年沟通时，显得僵化且缺乏灵活性。

核心内容

本研究基于 Kids Help Phone (KHP) 平台 2018 年至 2023 年间收集的 703,975 条去标识化对话数据，旨在突破静态分类体系的局限，提出一种新的表示方法。

1. 扩展分类体系 研究团队将 KHP 原有的 19 个标签的问题分类体系，扩展为一个包含 39 个标签的分层架构（Hierarchical Schema）。这一扩展旨在更细致地捕捉青少年面临的具体问题类型。

2. Keyphrase Generative Representation (KGR) 研究引入了一种名为“关键短语生成表示”（Keyphrase Generative Representation, KGR）的新方法。KGR 是一种受约束的大语言模型（LLM），其任务是为每一条对话生成简洁、特定于该对话内容的“关键短语”（Keyphrases）。

3. 评估与验证 研究团队通过 129 条对话和 387 次专家标注对 KGR 进行了评估。结果显示：

分类可靠性：扩展后的分类体系达到了专家共识可靠性，准确率为 0.96。
关键短语质量：专家审查发现，81% 的生成关键短语准确反映了对话内容，74% 的关键短语提高了内容的清晰度。
发现新主题：KGR 成功揭示了静态分类体系中缺失的、与身份认同相关的主题，例如“移民问题”（immigration problems）和“照顾者负担”（caregiver burden）。

4. 工作流改进 研究还测试了 KGR 在主题检索工作流（Topic-retrieval workflow）中的应用。结果显示，相比人工分析师的传统流程，引入 KGR 后，检索准确率从 0.25 提升至 0.70（提升了 +0.45）。

关键要点

数据规模与来源：研究分析了超过 70 万条 Kids Help Phone 的匿名对话数据，时间跨度为 2018-2023 年，确保了样本的代表性和时效性。
从静态到动态：传统的 19 标签分类体系过于僵化，无法适应青少年语言的变化。研究将其扩展为 39 标签的分层架构，提高了分类的颗粒度。
KGR 的核心机制：KGR 不是简单的分类器，而是一个受约束的 LLM 生成器。它生成的“关键短语”既保留了人类可读性（可解释性），又具备机器处理的效率。
专家验证的高一致性：扩展后的分类体系与专家判断的一致性极高（准确率 0.96），证明其分类逻辑符合人类专家的临床直觉。
捕捉隐性危机信号：KGR 能够识别出传统分类遗漏的文化背景和身份相关议题（如移民压力、家庭照顾负担），这些往往是青少年心理危机的深层诱因。
显著提升检索效率：在主题检索任务中，KGR 将准确率从 0.25 大幅提升至 0.70，证明了其在辅助分析师快速定位核心问题方面的巨大潜力。

意义与影响

这项研究标志着危机响应领域从“静态分类”向“混合、可解释的生成式表示”的重要转变。

超越静态分类的局限：通过引入生成式 AI 技术，研究证明了动态生成的关键短语比固定标签更能准确反映青少年复杂的心理状态和语境。这对于捕捉新兴的、文化特定的痛苦模式至关重要。
增强可解释性与透明度：与黑盒式的深度学习分类不同，KGR 生成的关键短语是人类可读的。这使得危机响应人员能够理解模型做出判断的依据，增加了系统的可信度和可用性。
优化危机干预工作流：KGR 在主题检索任务中表现出的高准确率提升，表明它可以作为强大的辅助工具，帮助分析师从海量对话中快速筛选出高风险案例，从而提高干预的及时性和有效性。
关注边缘与特定群体需求：通过发现“移民问题”和“照顾者负担”等特定主题，研究强调了技术工具在识别少数群体或特定社会背景下青少年心理需求方面的价值，有助于推动更具包容性和文化敏感性的心理健康服务。

总之，KGR 不仅是一种技术改进，更是一种方法论上的创新，它为利用 AI 技术更好地理解和响应青少年心理健康危机提供了新的路径。

查看原文 →arxiv.org