技术博客arXiv cs.AI·1 小时前

SchemaRAG：大模型动态缩减大型复杂架构信息提取

原标题：SchemaRAG: Dynamic Large Schema Reduction for LLM-driven Structured Information Extraction

速览

SchemaRAG是一种检索增强生成框架，针对大模型在处理大型复杂架构时提取结构化数据的挑战进行优化。它通过利用架构元数据和少量样本动态缩减架构空间，避免提示词过长导致的上下文溢出和中间丢失问题。实际评估在医疗和电商真实数据集上显示，SchemaRAG实现了微F1分数提升8.8%，延迟减少47%，令牌成本降低48%。这一方法显著提升了AI驱动的结构化信息提取效率，适用于大规模实际应用场景。

AI 深度解读

背景

随着大型语言模型（LLMs）在信息提取领域的广泛应用，结构化数据抽取任务变得尤为重要。传统的基于LLM的抽取方法往往依赖于全量提示，即将完整的目标模式（schema）直接嵌入提示中。然而，当模式规模较大且结构复杂时，这一做法会带来显著问题：首先，提示长度过长直接推高推理成本与延迟；其次，容易引发“丢失在中间”（lost-in-the-middle）性能退化；再次，可能突破LLM的上下文长度限制。为解决这些痛点，研究者提出SchemaRAG，一种检索增强生成（RAG）框架，针对模式驱动的结构化信息提取任务，通过动态剪枝输出模式空间来降低复杂度。

核心内容

SchemaRAG的核心思想是利用模式元数据与少样本示例（当可用时）来动态剪枝模式空间，从而为LLM提供更高效的提示。具体而言，在模式条件的信息提取任务中，SchemaRAG不会一次性加载全量模式，而是通过检索增强机制有选择地保留关键模式元素，避免无效或冗余信息的干扰。作者在真实世界医疗保健与电子商务数据集上进行了系统评估。结果表明，SchemaRAG相较于传统全量模式提示方法，在微观F1得分上可提升高达8.8%，延迟降低47%，token成本降低48%，充分证明了其在大规模模式抽取场景下的实用性。

关键要点

传统LLM驱动的结构化信息提取面临模式过大带来的成本、延迟与上下文溢出的挑战；
SchemaRAG采用RAG框架，结合模式元数据与少样本示例实现动态模式空间剪枝；
在医疗保健与电子商务真实数据集上的实验验证了SchemaRAG的效率优势；
相较基准，SchemaRAG带来8.8%微F1提升、47%延迟减少与48%token成本降低。

意义与影响

SchemaRAG为LLM在复杂模式条件下的结构化信息提取提供了一条可扩展、高效的路径。它显著缓解了传统方法在面对大规模模式时遇到的资源瓶颈与性能瓶颈，使LLM能够更轻松地处理真实世界中高维度、结构丰富的文本数据。这一突破不仅提升了抽取任务的精度与速度，更为后续的行业应用（如医疗记录自动化、电商商品属性抽取等）奠定了基础，推动了RAG技术在结构化信息提取领域的进一步落地与优化。

查看原文 →arxiv.org

SchemaRAG：大模型动态缩减大型复杂架构信息提取

速览

AI 深度解读

相关推荐