技术博客arXiv cs.CL·14 小时前

多样性注入位置决定生成效果：统一框架揭示关键杠杆

原标题：Where You Inject Diversity Matters: A Unified Framework for Diverse Generation

速览

针对大语言模型在开放生成任务中输出相似的问题，研究提出统一框架，通过分析多样性来源及其向最终输出的传递效率来评估生成方法。研究提出了一种全自动的规范级生成方法，先生成多样的中间规范，再据此生成最终响应。实验表明，该方法在保持质量的同时显著提升了输出多样性，揭示了源设计与源到输出实现是构建多样化生成系统的两大关键杠杆。

AI 深度解读

Where You Inject Diversity Matters: A Unified Framework for Diverse Generation

背景

在自然语言处理领域，开放式生成任务（Open-ended generation tasks）——如创意写作、头脑风暴或对话生成——通常要求模型产出一组在语义上截然不同、具有多样性的输出。然而，当前主流的大语言模型（LLMs）往往倾向于产生高度相似甚至重复的内容，这种“模式坍塌”现象限制了模型在需要创造性或多样性场景下的实用性。

为了解决这一问题，研究界提出了多种在测试时（Test-time）引入多样性的方法。这些方法通常作用于生成过程的不同阶段，例如通过调整采样策略（如 Temperature 缩放）、惩罚重复序列或修改解码算法。尽管现有方法在一定程度上提升了输出的多样性，但它们的有效性参差不齐，且缺乏一个统一的理论框架来解释：究竟什么样的设计选择才能真正导致输出具有“有意义”的多样性？目前，关于多样性注入的位置、方式及其对最终结果的影响机制，仍缺乏系统性的认知。

核心内容

本文提出了一种统一框架，旨在系统地表征和评估测试时多样性生成方法。该框架的核心观点是：多样性注入的位置（Where you inject diversity）至关重要。

1. 统一框架与传输评分（Transmission Score）

作者构建了一个分类框架，根据多样性来源（Diversity Source）在生成过程中被引入的阶段对现有方法进行归类。为了量化评估这些方法的有效性，作者引入了“传输评分”（Transmission Score）的概念。

多样性来源：指在生成过程中引入随机性或变化性的具体机制或数据点。
传输评分：衡量源（Source）中的变化有多少能够有效地传递并反映在最终输出中。如果多样性在生成早期被引入，但在后续步骤中被模型“平滑”或“忽略”，则传输评分低，最终输出依然缺乏多样性。

2. 规范级生成方法（Specification-level Generation）

基于上述框架的分析，作者提出了一种全自动的“规范级”生成方法。该方法将生成过程分为两个阶段：

生成多样化的中间规范（Intermediate Specifications）：首先，模型生成一组多样化的中间表示（即“规范”）。这些规范可以被视为对最终输出的粗略大纲、关键约束或语义骨架。
条件生成最终响应：随后，模型以这些多样化的中间规范为条件（Condition），生成最终的详细响应。

这种方法的优势在于，它在生成的早期阶段就强制引入了多样性，并通过规范作为桥梁，确保这种多样性能够有效地“传输”到最终输出中，而不是在解码过程中丢失。

3. 实验验证

作者在五个开放式任务和四个不同的骨干模型（Backbone Models）上进行了广泛评估。实验结果表明：

与现有的测试时基线方法相比，规范级注入（Specification-level injection）显著提高了输出的多样性。
在提升多样性的同时，该方法保持了与基线方法相当的内容质量（Quality），没有因为追求多样性而牺牲生成的准确性或流畅性。

4. 关键发现

深入分析显示，成功的多样性注入依赖于两个关键因素：

源的多样性：引入的多样性来源本身必须具有足够的区分度。
源到输出的实现：必须确保这种多样性能够有效地从注入点传递到最终输出。

关键要点

注入位置决定效果：多样性注入的时机和层级对最终输出的多样性有决定性影响。简单的解码层调整往往不如在语义层面（如规范层）引入多样性有效。
传输评分是新指标：提出了“传输评分”这一量化指标，用于评估多样性变化从引入点到最终输出的保留程度，为评估多样性方法提供了新的视角。
规范级生成策略：提出的“先生成多样化中间规范，再基于规范生成最终文本”的两阶段方法，是一种全自动且高效的多样性增强策略。
质量与多样性的平衡：该方法在显著提升多样性的同时，并未牺牲生成文本的质量，解决了以往方法中“多样性提升往往伴随质量下降”的痛点。
两大关键杠杆：构建更具多样性的生成系统，需重点关注“多样性源的设计”和“源到输出的实现机制”这两个杠杆。

意义与影响

这项研究为理解大语言模型中的多样性生成问题提供了重要的理论框架和实证依据。其意义主要体现在以下几个方面：

理论贡献：通过统一框架和传输评分，将原本分散的多样性优化方法纳入一个可比较、可量化的体系中，有助于研究人员更清晰地理解不同方法背后的机制差异。
实践指导：提出的规范级生成方法为开发者提供了一种即插即用的解决方案，特别是在需要高创造性输出的应用场景（如广告文案生成、故事创作、多视角观点生成）中，能够显著提升用户体验。
未来研究方向：研究强调了“源设计”和“传输机制”的重要性，指引未来工作应更多地关注如何设计更鲁棒的中间表示（Specifications）以及如何优化模型对中间信息的利用能力，而不仅仅是调整解码参数。

总之，这篇文章不仅提供了一种新的技术方法，更提供了一种思考大模型多样性生成的新范式：多样性不仅仅是解码时的随机性，更是生成结构中有意为之的结构性差异。

查看原文 →arxiv.org