技术博客arXiv cs.CL·2 天前

图增强检索提升跨实体金融情感分析

原标题：Graph-Augmented Retrieval for Cross-Entity Financial Sentiment Analysis: A Comparative Study

速览

该研究对比了图增强RAG与传统向量基线在跨实体金融情感分析中的表现。通过构建情感加权知识图谱并增强检索，图RAG在实体召回率和复杂查询回答相关性上取得显著提升。实验表明，该方法在不降低回答质量的前提下，有效解决了传统向量搜索难以捕捉结构化关系的问题。

AI 深度解读

Graph-Augmented Retrieval for Cross-Entity Financial Sentiment Analysis: A Comparative Study

背景

检索增强生成（Retrieval-Augmented Generation, RAG）技术已成为将大型语言模型（LLM）锚定在特定领域语料库中的基础架构。然而，在金融市场分析这一高度依赖结构化信息的场景中，传统的基于向量（Vector-based）的 RAG 系统存在根本性局限。金融市场的核心逻辑往往建立在实体之间复杂的、多跳的结构化关系之上，而单纯的向量检索难以有效捕捉这些深层的、多实体（Multi-entity）之间的关联。

本文针对这一痛点，提出并对比了一种新颖的两跳图 RAG（Graph-RAG）架构与标准的纯向量基线系统，旨在解决跨实体金融情感分析中的检索难题。研究重点在于如何通过引入知识图谱结构，增强检索系统对实体间影响力关系（Influences edges）的捕捉能力，从而提升复杂查询下的回答质量。

核心内容

本研究构建了一个包含 59 个股票实体和 255 篇新闻文章的知识图谱，覆盖 10 家主要科技股。该系统不仅构建了情感加权的知识图谱，还通过一种强度过滤的图遍历机制（Intensity-filtered graph traversal），在 INFLUENCES 边上进行检索，以揭示仅靠向量搜索无法获取的关系性证据。

实验设置与评估指标

研究团队在 100 个带接地（Grounded）查询的数据集上对两种架构进行了全面评估，其中包含 30 个直接查询（Direct）和 70 个关系型查询（Relational）。评估维度包括：

语义相似度（Semantic Similarity）
实体召回率（Entity Recall）
RAGAS 指标（RAGAS Metrics）
延迟基准测试（Latency Benchmarks）
消融实验（Ablation Studies）

主要发现

性能显著提升：Graph-RAG 在实体召回率上实现了统计显著的提升（+6.4%，p < 0.001，Wilcoxon 符号秩检验）。在处理复杂的多实体查询时，Graph-RAG 提供了显著更相关的回答，答案相关性（Answer Relevancy）提升了 11.7%。
关系型查询优势明显：性能增益主要集中在关系型问题类型上，此类问题的答案相关性提升了 16.1%。
质量与效率的平衡：
- 无质量损失：Graph-RAG 的性能提升并未以牺牲答案质量为代价。语义相似度的变化微乎其微（delta = +0.001，Cohen's d = 0.078），表明生成内容的准确性未受影响。
- 延迟优化：虽然平均延迟增加了 22.6%，但延迟方差大幅降低了 80%。这意味着系统响应的稳定性显著增强，减少了极端长尾延迟的情况。

参数敏感性分析

通过对图遍历强度阈值（Graph traversal intensity threshold）进行消融研究，研究发现答案质量与阈值之间存在倒 U 型关系（Inverted-U relationship）。研究确定最优阈值 $\tau = 0.5$，优于生产环境默认的 $\tau = 0.7$。这一发现揭示了图增强检索中固有的“精度-覆盖率”权衡（Precision-for-coverage trade-off）。

关键要点

传统 RAG 的局限：纯向量检索无法有效处理金融市场中实体间复杂的结构化关系，导致在多实体情感分析中表现不佳。
Graph-RAG 架构优势：通过引入两跳图检索和 INFLUENCES 边遍历，Graph-RAG 能够捕捉向量搜索遗漏的关系性证据，显著提升实体召回率（+6.4%）和复杂查询的答案相关性（+11.7%）。
关系型查询增益最大：对于涉及实体间相互作用的关系型问题，Graph-RAG 的性能提升最为显著（+16.1%）。
稳定性优于绝对速度：虽然 Graph-RAG 的平均延迟略有增加（22.6%），但其延迟方差大幅降低（80%），提供了更稳定、可预测的服务体验，且未损害答案的语义质量。
关键参数优化：图遍历强度阈值 $\tau$ 对性能有非线性影响，$\tau = 0.5$ 为最佳平衡点，而非默认值 0.7。这为构建多实体金融分析 RAG 系统提供了具体的架构指导。

意义与影响

这项研究为构建面向多实体金融分析的 RAG 系统提供了重要的架构指导。它证明了在金融等高度结构化领域，将知识图谱与检索增强生成相结合，能够有效克服传统向量检索的结构性盲区。

对于从业者而言，该研究揭示了在追求更高召回率和关系理解能力时，必须权衡检索的精度与覆盖率。通过调整图遍历强度阈值，可以在保证答案质量的前提下，优化系统的响应稳定性。这一发现不仅适用于金融情感分析，也为其他需要处理复杂实体关系的多跳推理场景提供了可复用的技术路径。

查看原文 →arxiv.org