技术博客arXiv cs.CL·2 天前

多语言大模型默认适用司法管辖区审计

原标题：Which Institutional Frameworks Do Chatbots Assume? Auditing Jurisdictional Defaults in Multilingual LLMs

速览

研究审计了七款中美大模型，发现其常以输入语言作为默认司法管辖区信号。中文输入多指向中国法律框架，英文输入多指向美国或通用框架。这种默认行为可能导致用户获得非预期的法律建议，存在制度框架误选风险。

AI 深度解读

聊天机器人预设了哪些制度框架？——多语言大语言模型中的司法管辖区默认值审计

背景

随着大型语言模型（LLMs）能力的提升，它们越来越多地回答涉及税收、劳动保护、医疗保健、教育、养老金以及行政程序等高度依赖具体司法管辖区（Jurisdiction）的问题。在这些场景中，回答的实用性往往取决于所适用的法律或行政框架。

然而，现实情况是，多语言用户通常使用自己最舒适的母语进行提问，而不是使用与问题所涉国家或地区规则相关的语言。例如，一位居住在美国的华裔用户可能用中文询问美国的税务问题。目前尚不清楚部署中的 LLM 是否在提示词（Prompt）未明确指定国家或地区时，将输入语言视为默认的司法管辖区信号。

先前的多语言审计研究表明，提示词的语言可以改变文化、政治或规范性输出。本文旨在深入考察当司法管辖区信息缺失时，模型究竟提供了哪些法律-行政框架，并评估这种“默认值”带来的潜在风险。

核心内容

本研究对七款在美国或中国开发的大型语言模型进行了系统性审计，重点考察其在司法管辖区未明确指定情况下的行为模式。

1. 实验设计与数据规模 研究团队构建了 60 个未明确指定司法管辖区的法律-行政类提示词，分别使用英语和普通话（Mandarin Chinese）进行测试。实验设置了三种系统提示（System Prompt）条件，共收集了 2,520 个手动标注的模型回答。

2. 主要发现：语言即默认司法管辖区 研究揭示了一个显著的方向性模式：

中文输入更倾向于产生针对中国的具体答案。
英语输入更倾向于产生针对美国的具体答案，或者是比较性、通用的答案。

3. 数据量化分析 在要求模型给出单一确定答案的提示词中，这种司法管辖区的选择倾向更加强烈。汇总所有模型的数据显示：

74.5% 的英语输入回答采用了美国框架。
53.3% 的中文输入回答采用了中国框架。

这一方向性模式在所有被测试的七款模型中均一致出现，表明这并非个别模型的偏差，而是部署层面的普遍现象。

4. 概念定义：制度框架误选风险（Institutional-Framework MisSelected Risk） 研究者将这种部署层面的模式定义为“制度框架误选风险”。其核心危害在于：模型可能给出一个流畅且看似专业的回答，但该回答所依据的法律-行政背景是用户并未意图适用的。这种情况在用户的首选语言与相关司法管辖区不一致时尤为危险。

5. 改进建议 研究指出，LLM 的界面设计不应仅凭输入语言来路由（Route）制度性建议。当用户提示中缺失地理位置信息时，模型应当：

主动请求用户明确其所在司法管辖区；
或者明确声明其回答所基于的司法管辖区范围。

关键要点

默认值偏差存在：多语言 LLM 在缺乏明确地理信息时，倾向于根据输入语言自动匹配特定的司法管辖区（英语->美国，中文->中国）。
高风险场景：在税收、劳动法、医疗等强监管领域，这种默认匹配可能导致用户依据错误的法律框架做出决策，造成实质性损害。
普遍性现象：该偏差在七款不同模型中均被观察到，说明这是当前多语言大模型架构或训练数据分布中的系统性问题，而非单一模型的 Bug。
中文用户的特定风险：对于使用中文但身处非中国司法管辖区（如海外华人）的用户，模型更有可能提供不符合当地法律的答案（约 53.3% 的概率套用中国框架），这构成了显著的合规与安全盲区。
交互设计缺陷：当前的 LLM 接口缺乏必要的“地理确认”机制，未能将语言偏好与法律适用性解耦。

意义与影响

1. 对 AI 安全与合规的挑战 这项研究揭示了多语言大模型在垂直领域应用中的深层安全隐患。传统的“多语言支持”往往被理解为翻译能力的提升，但本研究指出，多语言模型实际上携带了隐性的“文化-法律预设”。在金融、法律、医疗等专业领域，这种预设可能导致严重的合规风险。

2. 对模型训练与对齐的启示 开发者和研究人员需要重新审视多语言数据的处理方式。仅仅增加多语言语料库并不足以解决司法管辖区混淆问题。未来的模型对齐（Alignment）工作可能需要引入更复杂的上下文感知机制，或者在训练阶段明确区分“语言风格”与“事实/法律背景”。

3. 产品设计与用户体验 对于 LLM 产品提供商而言，这篇论文提出了明确的产品改进方向：

主动澄清：当检测到用户询问涉及具体法规的问题且未提供位置信息时，系统应强制弹出位置选择或确认对话框。
透明化声明：在回答中明确标注所依据的法律体系（例如：“以下建议基于美国联邦法律...”），避免用户产生误解。

4. 学术研究的延伸 该研究为“语言相对论”在 AI 领域的延伸提供了实证支持。它表明，语言不仅是交流工具，在 AI 系统中，它还被赋予了定义现实框架（如法律、行政）的权力。这为后续研究语言如何塑造 AI 对世界认知的逻辑提供了新的切入点。

查看原文 →arxiv.org