技术博客arXiv cs.CL·1 小时前

提出鲁棒配对置信度学习框架，提升多模态情感-原因配对提取性能

原标题：Learning Robust Pair Confidence for Multimodal Emotion-Cause Pair Extraction

速览

针对多模态情感-原因配对提取（MECPE）中配对置信度脆弱的问题，研究提出RPCL（鲁棒配对置信度学习）训练框架。该框架通过置信度差异约束和去噪对齐策略，使黄金配对与困难负样本拉开距离并提升预测稳定性。实验表明，RPCL在ECF、MECAD和MEC4数据集上显著提升了Pair F1和AUPRC指标，验证了显式塑造配对置信度的有效性。

AI 深度解读

学习鲁棒的配对置信度：多模态情感-原因配对提取的新范式

背景

多模态情感-原因配对提取（Multimodal Emotion-Cause Pair Extraction, MECPE）是自然语言处理与多模态学习中的一个关键任务。其目标是从包含文本、音频和视频线索的多模态数据中，准确识别出引发特定情感表达的原因片段，并将情感片段与原因片段配对。

现有的 MECPE 方法通常依赖于“配对评分器”（pair scorers）来评估候选配对的质量。传统的评分器主要在有效候选者之间计算配对级别的交叉熵（pair-level cross entropy）。这种方法的潜在缺陷在于，它倾向于将各个链接视为相互独立的事件，从而忽视了竞争原因之间的相对置信度几何结构（relative confidence geometry）。

这种独立性假设导致了一个被称为“配对置信度脆弱性”（pair-confidence brittleness）的问题：

相对置信度约束不足：模型难以在多个竞争原因中建立清晰的置信度层级。
黄金配对易混淆：真正的黄金配对（gold pairs）可能与难以区分的负样本（hard negatives）在置信度上过于接近。
依赖偶然上下文：模型可能依赖于非黄金配对的偶然性上下文信息，而非真正的情感-因果逻辑。

为了解决这一痛点，研究人员提出了 RPCL (Robust Pair Confidence Learning)，一种仅针对训练阶段的框架，旨在通过塑造鲁棒的配对置信度来提升 MECPE 的性能。

核心内容

RPCL 框架的核心思想是鼓励配对置信度同时具备判别性（discriminative）和稳定性（stable）。它通过两个主要机制来实现这一目标，且完全不需要改变推理时的原始评分器和解码流水线。

1. 基于置信度差异边界的判别性增强

为了解决黄金配对与竞争负样本难以区分的问题，RPCL 引入了一个置信度差异边界约束（confidence-difference margin constraint）。

机制：在训练过程中，模型被强制要求黄金配对的置信度与行内难负样本（row-wise hard negatives，即同一情感下其他可能的错误原因）的置信度之间保持一定的最小差距。
效果：这种机制迫使模型在特征空间中拉开黄金配对与最具挑战性负样本之间的距离，从而增强模型对正确配对的判别能力，减少误判。

2. 基于视图污染对齐的稳定性提升

为了提高模型对噪声和非关键上下文的鲁棒性，RPCL 采用了视图污染对齐（alignment with corrupted view）策略。

机制：
- 原始视图：使用干净的配对预测。
- 污染视图：对非黄金上下文的 utterance representations（话语表示）进行部分破坏或掩码处理，模拟噪声环境。
- 对齐损失：模型被训练为使原始干净视图的预测结果与经过污染处理的视图的预测结果保持一致。
效果：通过这种方式，模型学会忽略那些非因果性的、偶然的上下文信息，转而关注更稳定、更本质的情感-原因关联特征。即使上下文部分受损，模型仍能保持对正确配对的置信度估计。

3. 推理阶段的零成本适配

RPCL 是一个纯粹的训练时框架（training-only framework）。在推理（inference）阶段，研究人员直接使用原始的、未经修改的干净配对评分器和解码流水线。这意味着 RPCL 可以无缝集成到现有的 MECPE 系统中，无需在部署时增加额外的计算开销或修改模型架构。

4. 实验验证

研究者在三个标准数据集上验证了 RPCL 的有效性：ECF、MECAD 和 MEC4。

性能提升：在完整的文本-音频-视频设置下，RPCL 使匹配的基础模型在三个随机种子的平均 Pair F1 分数上提升了 2.58 到 2.83 个百分点。
排序能力增强：在所有三个数据集上，平均 Pair AUPRC（曲线下面积）均得到提升，表明模型在排序候选配对时的整体能力增强。
诊断分析：进一步的分析显示，RPCL 模型具有更大的黄金配对与负样本之间的置信度差距，且边界违反程度（margin-violation severity）更低，证实了其鲁棒性。

关键要点

问题定义：现有 MECPE 方法因独立处理配对链接，导致“配对置信度脆弱性”，使得黄金配对难以与难负样本区分，且易受偶然上下文干扰。
解决方案：提出 RPCL (Robust Pair Confidence Learning)，一种仅用于训练的框架，旨在学习鲁棒的配对置信度。
核心机制一（判别性）：通过置信度差异边界约束，强制黄金配对与行内难负样本在置信度上保持分离，增强区分能力。
核心机制二（稳定性）：通过视图污染对齐，使模型对非黄金上下文表示的部分破坏具有鲁棒性，减少对偶然信息的依赖。
部署优势：推理阶段无需任何修改，直接使用原始评分器和解码器，零额外推理成本。
实证结果：在 ECF、MECAD 和 MEC4 数据集上，RPCL 使平均 Pair F1 提升 2.58-2.83%，并显著改善 Pair AUPRC。
诊断结论：RPCL 有效扩大了黄金-负样本的置信度差距，降低了边界违反率，证明了显式塑造配对置信度是 MECPE 任务的有效策略。

意义与影响

RPCL 的提出为多模态情感-原因配对提取任务提供了新的视角，其意义主要体现在以下几个方面：

从“独立评分”到“相对几何”的转变：传统方法往往将配对评分视为独立事件，而 RPCL 强调了竞争原因之间的相对置信度几何结构。这种转变使得模型能够更准确地理解“为什么这个原因是最好的”，而不仅仅是“这个原因看起来像不像”。
鲁棒性优先的训练范式：通过引入视图污染和对齐损失，RPCL 展示了如何通过数据增强和一致性正则化来提升模型对噪声和无关上下文的鲁棒性。这对于实际应用中处理嘈杂、非结构化多模态数据具有重要参考价值。
即插即用的优化策略：作为一个仅改变训练过程而不影响推理架构的框架，RPCL 具有极高的实用价值。它允许研究人员在不增加部署复杂度的情况下，显著提升现有基线模型的性能。
对多模态因果推理的启示： MECPE 本质上是多模态因果推理的一种形式。RPCL 的成功表明，显式地约束模型对“因果配对”的置信度分布，可以有效缓解多模态融合中的噪声干扰和歧义问题。这一思路可推广至其他需要精确配对或因果推断的多模态任务中。

总之，RPCL 不仅解决了 MECPE 中的具体技术瓶颈，也为多模态学习中如何构建更鲁棒、更具判别性的置信度估计提供了通用的方法论指导。

查看原文 →arxiv.org