技术博客arXiv cs.CL·1 小时前

多语言大模型数学推理参数共享还是独立？

原标题：LLM Parameters for Math Across Languages: Shared or Separate?

速览

该研究通过机制分析发现，大模型在不同语言下的数学推理能力差异并非完全由语言特定参数或共享机制单独决定，而是呈现部分跨语言参数重叠。其中，重叠最强的区域集中在模型的中间层。此外，英语始终拥有最多的数学相关参数，而低资源语言的相关参数集合较小。

AI 深度解读

LLM 数学推理参数跨语言共享还是独立？深度解读

背景

大型语言模型（LLMs）在多语言环境下的表现日益受到关注，但在数学推理这一特定任务上，不同语言之间的性能差异显著。尽管我们观察到模型在处理英语、中文、西班牙语等不同语言时的数学能力存在明显波动，但学术界对于这种差异的本质仍缺乏清晰的认识：这些差异究竟反映了模型内部是否存在针对特定语言的独立参数机制，还是说模型拥有一个共享的数学推理核心，只是在不同语言下通过不同的路径或权重激活来表现？

理解这一问题的关键在于“机制解释性”（Mechanistic Interpretability）。传统的评估方法通常仅关注输入输出层面的准确率，而忽略了模型内部是如何处理逻辑和数字信息的。如果数学能力是语言无关的（Language-invariant），那么优化一种语言的数学能力应该能泛化到其他语言；反之，如果数学能力是语言特定的（Language-specific），那么多语言模型的数学能力提升可能需要针对每种语言单独进行微调或训练。

这项来自 arXiv cs.CL 的研究（提交于 2026 年 6 月 16 日）试图通过跨语言的机制分析来解决这一核心争议。研究团队旨在定位并比较支持不同语言数学推理的模型参数，从而揭示多语言 LLM 中数学知识的存储和调用方式。

核心内容

本研究提出了一种跨语言的机制分析方法，用于深入剖析 LLM 中的数学推理过程。其核心目标是识别出那些与数学推理密切相关的模型参数，并分析这些参数在不同语言之间是共享的还是独立的。

1. 方法论：跨语言机制定位

研究团队并未止步于黑盒式的性能测试，而是采用了可解释性 AI 的技术手段，对模型内部结构进行了“解剖”。他们通过激活追踪和参数归因技术，定位了那些在数学推理任务中被显著激活的神经元和参数层。随后，他们将这些参数集在不同语言（如英语、中文、低资源语言等）的推理任务中进行对比，以量化其重叠程度。

2. 主要发现：部分重叠与层级差异

研究结果揭示了一个复杂而非非黑即白的图景：

部分跨语言重叠（Partial Cross-lingual Overlap）： 提取出的与数学相关的参数在不同语言之间确实存在重叠，但这并非完全共享。这意味着多语言 LLM 中确实存在某种通用的数学处理机制，但这种机制并不覆盖所有数学推理所需的计算步骤。
中间层集中效应： 这种参数重叠在模型的**中间层（Intermediate Layers）**最为显著。这暗示了数学推理的抽象逻辑处理可能发生在模型的中部，而顶层可能更多地涉及语言生成的具体形式，底层则涉及词嵌入和基础语义。
英语的主导地位： 在所有测试语言中，**英语（English）**始终产生了最大规模的“数学相关参数集”。这可能与预训练数据中英语语料的丰富程度、质量以及数学符号在英语语境下的标准化程度有关。
低资源语言的局限： 相比之下，低资源语言（Lower-resource languages）展现出的相关参数集较小。这表明模型在处理非英语、数据稀缺语言的数学问题时，可能缺乏足够精细的参数支持，导致推理能力下降。

3. 结论：非全共享，非全独立

基于上述发现，研究得出结论：多语言 LLM 中的数学相关行为既不是完全语言不变的（Fully Language-invariant），也不是完全语言特定的（Fully Language-specific）。相反，它表现出一种混合状态：存在部分跨语言的参数重叠，同时伴随着系统的、依赖于语言特性的差异。

关键要点

机制验证： 研究通过跨语言机制分析，证实了 LLM 内部存在可定位的、与数学推理相关的特定参数子集。
重叠层级： 数学参数的跨语言重叠主要集中在模型的中间层，而非输入或输出层。
语言不对称性： 英语拥有最庞大且最完整的数学相关参数集，显示出其在多语言模型中的“基准”或“主导”地位。
资源依赖性： 低资源语言的数学推理参数集较小，解释了为何这些语言在数学任务上表现较差，且这种差异源于模型内部参数的稀疏性而非仅仅是表面语言结构的差异。
混合机制模型： 多语言 LLM 的数学能力由“共享的通用数学逻辑”和“特定的语言映射机制”共同构成，二者缺一不可。

意义与影响

这项研究对多语言大语言模型的开发、优化及部署具有深远的影响：

优化策略的转变： 传统的多语言模型优化往往假设提升通用能力即可惠及所有语言。然而，本研究指出，由于英语参数集最大且低资源语言参数集较小，简单的通用预训练可能不足以平衡各语言的数学能力。未来的优化可能需要针对低资源语言进行参数高效微调（PEFT）或特定语言的补充训练，以扩充其数学相关的参数覆盖范围。
模型架构设计的启示： 发现重叠集中在中间层，提示架构师可以在这些关键层引入语言无关的数学模块或注意力机制，以增强跨语言的数学泛化能力。
公平性与包容性： 研究揭示了低资源语言在数学推理上的结构性劣势。这提醒开发者，如果不加干预，多语言模型可能会加剧数字鸿沟，因为低资源语言用户不仅在语言理解上处于劣势，在逻辑推理等高阶认知任务上也面临更大的技术障碍。
可解释性的应用： 该研究展示了机制解释性在理解多语言模型行为中的强大力量。通过定位具体参数，我们可以更精准地诊断模型故障，例如区分是“不懂数学”还是“不懂该语言的数学表达方式”。

总之，这项研究打破了“数学能力在多语言模型中是完全通用”的简单假设，为构建更均衡、更强大的多语言 AI 系统提供了重要的理论依据和技术路径。

查看原文 →arxiv.org