← 返回信息流
技术博客arXiv cs.CL·3 小时前

CORTEX: Token-Level Hallucination Detection in RAG via Comparative Internal Representations

AI 深度解读

背景

检索增强生成(RAG)技术通过引入外部知识库来缓解大语言模型(LLM)的固有幻觉问题,已成为构建可信 AI 系统的标准范式。然而,在实际的长文本生成场景中,幻觉往往并非均匀分布在整个回答中,而是集中在某些局部的跨度。现有的幻觉检测方法多停留在句子或篇章级别,难以精准定位这些局部幻觉,这不仅限制了 RAG 系统的可靠性,也降低了其可解释性。如何在 Token 级别实现细粒度的幻觉检测,是当前 RAG 领域亟待解决的关键问题。

核心内容

本文提出了 CORTEX,一种面向 RAG 的 Token 级别幻觉检测方法,旨在实现幻觉的细粒度精准定位。

CORTEX 的核心直觉在于:在 RAG 系统中,那些基于检索文档生成的 Token,理应比幻觉 Token

查看原文 →arxiv.org