技术博客arXiv cs.CL·3 小时前

利用脑电与眼动信号增强微博关键词提取

原标题：Utilizing Cognitive Signals Generated during Human Reading to Enhance Keyphrase Extraction from Microblogs

速览

针对微博短文本噪声大导致自动关键词提取困难的问题，研究利用ZuCo语料库，将脑电（EEG）和眼动特征注入注意力机制模型。实验表明，阅读过程中产生的认知信号能持续提升提取性能，其中脑电特征增益最大，多模态信号展现了互补潜力。

AI 深度解读

利用人类阅读产生的认知信号增强微博关键词提取

来源：arXiv cs.CL 提交日期：2026年6月25日标题：Utilizing Cognitive Signals Generated during Human Reading to Enhance Keyphrase Extraction from Microblogs

背景

微博等微型博客平台每天生成海量的短文本内容。这些内容通常具有短小、嘈杂且分散的特点，使得从这些非结构化数据中自动提取关键短语（Automatic Keyphrase Extraction, AKE）成为一项重要但极具挑战性的任务。

传统的 AKE 方法主要依赖文本本身的统计特征或上下文语义，往往难以精准捕捉用户真正关注的核心信息。近年来，研究者开始尝试引入**眼动追踪（Eye-tracking）**信号来辅助这一任务，因为眼动数据能够直观反映读者对显著词汇的注意力分布。

然而，仅依靠眼动追踪存在明显的局限性。它受到生理机制、数据采集设备限制以及特征解码复杂度的制约，无法全面反映人类阅读过程中的深层认知状态。为了突破这一瓶颈，本研究旨在探索是否可以使用**脑电图（Electroencephalogram, EEG）**信号来补充眼动追踪信号，从而更准确地模拟人类阅读时的认知过程，进而提升 AKE 的性能。

核心内容

本研究基于 ZuCo 认知语言处理语料库（ZuCo cognitive language processing corpus），系统地评估了多模态认知信号在微博客关键词提取中的应用效果。

1. 数据与特征选择

研究团队从 ZuCo 语料库中筛选并提取了以下两类认知特征：

EEG 特征：共 8 个特征，用于捕捉大脑在处理语言信息时的电生理活动。
眼动追踪特征：共 17 个特征，用于记录眼球运动轨迹及注视点。

2. 模型架构与信号注入策略

为了避免模型结构本身对认知信号造成扭曲或干扰，研究采用了特定的注入策略，将认知特征直接嵌入到注意力机制的关键位置：

软注意力层（Soft-attention layer）：将认知特征注入该层的输入端。
自注意力层（Self-attention layer）：将认知特征注入查询向量（Query vectors）。

这种设计旨在让模型在计算注意力权重时，直接受到人类真实认知信号的影响，从而更精准地识别文本中的关键短语。

3. 实验评估

研究在不同组合的认知信号和不同的 AKE 模型架构下进行了广泛的评估，主要考察以下方面：

单独使用 EEG 信号的效果。
单独使用眼动信号的效果。
结合 EEG 和眼动信号的多模态效果。

4. 主要发现

实验结果证实，在阅读过程中产生的认知信号能够一致性地提升 AKE 模型的性能，这一结论不受特征组合方式或模型架构的影响。具体表现如下：

EEG 贡献最大：EEG 特征带来的性能提升幅度最大，表明大脑电生理活动对于理解文本语义具有极高的价值。
多模态互补与冗余：结合 EEG 和眼动追踪特征所得到的性能，介于两者单独使用之间。这暗示了两种信号之间存在部分互补性，但也可能存在一定的冗余或噪声干扰。

关键要点

痛点突破：传统眼动追踪在 AKE 任务中受限于生理和解码约束，引入 EEG 信号可有效弥补这一不足，提供更深层的认知证据。
创新注入方式：研究并未简单拼接特征，而是将认知信号注入到 Transformer 架构中的软注意力输入和自注意力查询向量中，以减少模型结构对原始认知信号的扭曲。
EEG 的主导作用：在所有测试中，EEG 特征对性能提升的贡献最为显著，证明了神经信号在捕捉文本显著性方面的强大能力。
多模态的复杂性：虽然结合 EEG 和眼动信号有效，但其效果并非简单的“1+1>2”，而是介于两者之间，提示未来研究需进一步处理信号间的冗余和噪声问题。
鲁棒性验证：认知信号的增强效果在不同模型架构和特征组合下均保持一致，证明了该方法的通用性和可靠性。

意义与影响

这项研究为自然语言处理（NLP）与认知科学的交叉领域提供了新的视角。它证明了多模态认知信号（特别是 EEG）在微博客等嘈杂短文本处理中具有巨大的应用潜力。

提升信息提取精度：通过模拟人类阅读时的真实认知过程，AKE 系统能够更准确地识别用户关注的核心概念，这对于社交媒体监控、新闻摘要生成和用户兴趣分析具有重要意义。
推动认知计算发展：研究揭示了 EEG 信号在语言理解任务中的独特价值，鼓励开发者在构建 NLP 模型时，更多地考虑人类认知的生物学基础。
未来研究方向：鉴于 EEG 和眼动信号结合时存在的冗余和噪声问题，未来的工作应致力于开发更先进的信号融合算法，以最大化多模态认知的互补优势，同时最小化噪声干扰。

总之，该研究不仅验证了利用认知信号增强 AKE 的可行性，也为后续探索更复杂的人机交互和智能文本处理系统奠定了理论基础。

查看原文 →arxiv.org