技术博客arXiv cs.AI·2 小时前

发布CIFAR合成证据语料库以检测AI生成证据

原标题：The CIFAR Synthetic Evidence Corpus for Detecting AI-Generated Evidence

速览

生成模型日益逼真的文档能力对司法证据真实性构成挑战，但现有检测系统因缺乏专用数据而受限。为此，研究团队推出CIFAR合成证据语料库，涵盖多种文档类型及从局部修改到完全伪造的多样化篡改策略。该语料库通过严格分离训练与测试数据，旨在为司法场景下的证据验证提供严谨的评估基准。

随着生成式人工智能（Generative AI）能力的飞速提升，AI 生成逼真文档的能力日益增强，这对司法系统和法院的证据工作流程构成了直接且严峻的挑战。在现代司法实践中，判决结果越来越依赖于对收据、通信记录、行政文件等证据真实性的认定。

然而，与社交媒体内容或学术论文不同，司法证据往往只经过细微的修改。这些修改通常是局部且微小的，旨在保持文档整体上的合理性（plausibility），同时改变其法律含义。这种“微调”使得传统的检测方法难以奏效。

目前，自动化检测技术的进展有限，主要瓶颈在于缺乏适合司法系统需求的训练和评估数据。现有的公开数据集存在明显的局限性：

由于缺乏高质量的数据支持，当前的检测系统往往无法学习到适用于司法场景的有效信号，导致其在面对精心伪造的证据时表现不佳。

为了解决上述数据匮乏问题，研究团队引入了 CIFAR Synthetic Evidence Corpus（CIFAR 合成证据语料库）。这是一个专为在现实且受控条件下严格评估证据验证技术而设计的数据集。

该语料库的核心构建逻辑与特点如下：

CIFAR 语料库涵盖了多个文档家族，并模拟了从简单到复杂的多种操纵策略光谱：

数据集的构建使用了多种最先进的生成式工具（state-of-the-art generative tools）。通过引入多样化的生成源，确保了数据能够反映不同 AI 模型产生的特征，避免检测模型过拟合于单一生成器的痕迹。

该语料库的组织结构旨在系统地变化两个关键维度：

为了确保评估结果反映真实的泛化能力，该数据集在训练数据和测试数据之间强制执行“源级分离”。这意味着训练集中使用的生成器或文档源，不会出现在测试集中。这种设计模拟了现实世界中检测系统面对未知生成源或新型伪造手段时的挑战，迫使模型学习更本质的伪造特征，而非仅仅记忆特定生成器的噪声模式。

CIFAR Synthetic Evidence Corpus 的发布填补了司法证据自动化检测领域的关键空白。

提升检测系统的鲁棒性：通过提供多样化且结构严谨的数据，该语料库使得研究人员能够开发出能够识别细微法律意义变更的检测模型，从而提高司法系统中证据验证的准确性。
推动 AI 治理与法律科技的发展：随着 AI 生成内容的普及，确保证据链的完整性对于维护司法公正至关重要。该数据集为法律科技（LegalTech）领域提供了标准化的评估基准，有助于建立更可靠的 AI 辅助证据审查流程。
促进通用伪造检测研究：虽然专注于司法证据，但其关于“源级分离”和“细微操纵”的研究方法，也可推广至其他需要高可靠性内容验证的场景，如金融审计、新闻真实性核查等。

总之，CIFAR 语料库不仅是一个数据集，更是连接生成式 AI 能力与司法系统安全需求之间的重要桥梁，为应对 AI 时代证据真实性挑战提供了必要的技术基础设施。