技术博客arXiv cs.CL·3 天前

跨语言激活引导实现比喻语言生成

原标题：Cross-Lingual Steering for Figurative Language Generation

速览

研究利用激活引导技术，发现多语言大模型中驱动比喻语言生成的内部信号具有跨语言可迁移性。实验表明，在一种语言中学习到的引导方向能有效提升其他语言的比喻生成能力，且组合多语言信号甚至可超越单一语言原生效果。这为理解大模型跨语言语义共享机制提供了直接证据。

多语言大型语言模型（Multilingual LLMs）在生成比喻性语言（Figurative Language，如隐喻、明喻等）方面已展现出显著能力。然而，学术界对于驱动这种行为的内部机制仍存在疑问：这些信号是特定于某种语言的，还是可以在不同语言之间复用？

传统的自然语言处理研究往往将不同语言视为独立的实体，忽略了它们在语义和认知层面的深层共性。随着多语言模型（如 Llama、BLOOM 等）的普及，理解模型如何在不同语言间共享“创造性”或“修辞性”思维模式，成为提升模型跨语言泛化能力和可控生成能力的关键课题。

本文提出了一种名为“激活导向”（Activation Steering）的探测方法，旨在揭示多语言 LLM 内部处理比喻性语言的机制。研究团队通过对比“比喻性”与“字面性”激活状态的差异，提取出特定的方向向量，并观察这些向量在不同语言环境下的表现。

研究人员利用激活导向技术作为探针，从一种语言中提取出针对特定比喻类别的方向向量。具体而言，他们计算了模型在处理比喻性文本与字面性文本时神经元激活状态的差异，从而得到一个指向“比喻性”的思维方向。随后，在生成过程中，通过沿该方向调整模型的激活状态，来引导模型生成更具比喻性的内容。

为了验证这一假设，研究进行了大规模实验，覆盖了：

语言内的可靠性：在单一语言内部，提取出的方向向量能够可靠地引导模型生成目标比喻类型。其中，对于隐喻和明喻的引导效果最为稳健。
跨语言的可迁移性：这是本研究的核心突破。从一个语言中学习到的方向向量，应用到另一种语言时，依然能显著提高目标比喻行为的发生率。这表明，模型内部存在一种跨语言的、可复用的比喻生成信号。
语言间的差异性：不同语言对跨语言方向的接受程度不同。例如，德语（German）被证明是最容易接受这种跨语言引导的目标语言之一。
共享信号的主导地位：进一步分析发现，由其他语言组装而成的方向向量，其效果可以匹配甚至超越目标语言自身提取的本地方向向量。相反，如果移除这种共享的跨语言组件，目标语言自身的引导效果反而会减弱。

这项研究对多语言大语言模型的开发和应用具有深远意义：

提升可控生成能力：通过理解并利用跨语言的激活方向，开发者可以更精细地控制多语言模型的输出风格，特别是在需要生成诗歌、文学或广告文案等需要修辞技巧的场景中。
数据效率优化：既然一个语言学到的方向可以迁移到其他语言，那么只需在少数资源丰富的语言上收集高质量的比喻数据并提取方向，即可增强其他低资源语言的比喻生成能力，从而降低数据收集和标注成本。
深化对模型内部机制的理解：研究揭示了多语言模型并非简单地将不同语言映射到独立的语义空间，而是在深层激活空间中共享了某种高级的认知或修辞结构。这为解释多语言模型的泛化能力提供了新的视角。
促进跨文化内容创作：具备强大跨语言比喻生成能力的模型，能够更好地理解和生成符合不同文化语境修辞习惯的内容，有助于打破语言壁垒，促进全球范围内的创意内容交流。

总之，这项工作不仅验证了多语言模型内部比喻生成机制的跨语言共性，也为未来开发更高效、更可控的多语言创意生成系统奠定了理论基础。