技术博客arXiv cs.CL·4 小时前

基于思维树启发的大模型混合方法用于法律判决摘要

原标题：A Tree-of-Thoughts Inspired Hybrid Approach for Legal Case Judgement Summarization using LLMs

速览

针对法律判决摘要任务，研究提出了一种受思维树启发的提取-生成混合摘要方法。该研究对比了提取式、生成式及混合式提示在DeepSeek和Llama等大模型上的表现。实验结果表明，混合式提示能生成质量更高的法律摘要。

随着大型语言模型（LLMs）在自然语言处理领域的突破性进展，其在法律科技（LegalTech）中的应用日益广泛。其中，法律判决书摘要生成是一项极具挑战性但也极具价值的任务。判决书通常篇幅冗长、逻辑复杂且包含大量专业术语，人工阅读和提炼关键信息成本高昂。

在早期的研究中，针对法律文本的摘要生成主要依赖于两种传统范式：

抽取式摘要（Extractive Summarization）：直接从原文中选取重要的句子或片段进行拼接。这种方法保真度高，但往往缺乏连贯性，且难以捕捉深层逻辑。
生成式/抽象式摘要（Abstractive Summarization）：模型理解原文后，用自己的语言重新生成摘要。这种方法可读性更强，但存在“幻觉”风险，即在法律场景中，事实性错误是致命的。

尽管混合方法（Hybrid Approach）——即结合抽取式的准确性和生成式的流畅性——在其他领域已被证明有效，但在法律判决书摘要这一垂直领域，尤其是结合最新的大语言模型时，相关的探索仍然较少。大多数现有工作仍局限于单一的抽取或生成模式，未能充分发挥两者互补的优势。

本文提出了一种受“思维树”（Tree-of-Thoughts, ToT）启发的混合摘要方法，旨在解决上述痛点。该方法的核心在于构建一个**抽取-生成混合（Extractive-Abstractive）**的提示工程框架，并通过实验验证其在法律场景下的优越性。

传统的思维树（ToT）框架允许模型在推理过程中探索多条可能的路径，并通过评估选择最优解。本文借鉴这一思想，设计了以下流程来优化法律摘要的生成：

混合提示策略：模型不再被要求直接生成摘要，而是被引导先执行“抽取”步骤，识别判决书中的关键事实、争议焦点和判决依据；随后，基于这些抽取出的关键要素，执行“生成”步骤，构建连贯的法律摘要。
结构化推理：通过提示词工程，强制模型在生成最终摘要前，先梳理出逻辑链条。这种结构化的处理方式模拟了人类律师阅读判决书时的思维过程：先抓重点（抽取），再写文书（生成）。

为了验证该方法的有效性，研究团队选择了两个当前主流的大语言模型进行对比实验：

实验设计涵盖了三种不同的摘要模式对比：

实验数据表明，**抽取-生成混合摘要提示（Extractive-Abstractive Prompt）**在各项指标上均优于其他两种单一模式。具体表现为：

填补研究空白：本文首次系统性地探索了抽取-生成混合技术在法律判决书摘要中的应用，此前该领域多集中于单一范式。
思维树（ToT）的迁移应用：创新性地将对自然语言推理有效的思维树框架迁移至法律摘要任务，通过结构化提示引导模型进行分步推理。
混合模式的优势：证明了“先抽取关键要素，后生成连贯文本”的混合策略，在平衡法律文本的事实准确性与阅读流畅性方面，优于传统的纯抽取或纯生成方法。
主流模型验证：实验覆盖了 DeepSeek 和 Llama 两款代表性大模型，证实了该方法在不同架构下的有效性。
提示工程的重要性：研究强调了精心设计的提示词（Prompt）对于激发大模型在法律垂直领域潜力的关键作用。

这项研究对法律科技和大语言模型应用具有多重深远影响：

提升法律工作效率：通过提供更准确、更连贯的判决书摘要，律师和法律助理可以更快地掌握案件核心，减少阅读数百页判决书的时间成本，从而将更多精力投入到策略制定和庭审准备中。
降低“幻觉”风险：在法律领域，事实错误可能导致严重的后果。混合方法通过抽取步骤锚定事实，有效抑制了纯生成模型常见的幻觉问题，提高了AI辅助法律工作的可信度。
推动垂直领域LLM优化：本文为如何更好地利用通用大模型解决专业领域问题提供了新的思路。它表明，通过引入类似思维树的推理结构和混合生成策略，可以显著提升模型在复杂逻辑任务中的表现。
促进法律透明度：高质量的摘要有助于公众和非专业人士理解复杂的法律判决，促进司法信息的透明化和普及化。

总之，这项研究不仅提出了一种更优的技术方案，也为大语言模型在法律行业的落地应用提供了重要的实践参考。随着法律数据的积累和模型的迭代，基于混合推理的摘要工具有望成为法律科技基础设施的重要组成部分。