← 返回信息流
技术博客arXiv cs.CL·2 天前

多语言大模型默认适用司法管辖区审计

原标题:Which Institutional Frameworks Do Chatbots Assume? Auditing Jurisdictional Defaults in Multilingual LLMs

速览

研究审计了七款中美大模型,发现其常以输入语言作为默认司法管辖区信号。中文输入多指向中国法律框架,英文输入多指向美国或通用框架。这种默认行为可能导致用户获得非预期的法律建议,存在制度框架误选风险。

AI 深度解读

聊天机器人预设了哪些制度框架?——多语言大语言模型中的司法管辖区默认值审计

背景

随着大型语言模型(LLMs)能力的提升,它们越来越多地回答涉及税收、劳动保护、医疗保健、教育、养老金以及行政程序等高度依赖具体司法管辖区(Jurisdiction)的问题。在这些场景中,回答的实用性往往取决于所适用的法律或行政框架。

然而,现实情况是,多语言用户通常使用自己最舒适的母语进行提问,而不是使用与问题所涉国家或地区规则相关的语言。例如,一位居住在美国的华裔用户可能用中文询问美国的税务问题。目前尚不清楚部署中的 LLM 是否在提示词(Prompt)未明确指定国家或地区时,将输入语言视为默认的司法管辖区信号。

先前的多语言审计研究表明,提示词的语言可以改变文化、政治或规范性输出。本文旨在深入考察当司法管辖区信息缺失时,模型究竟提供了哪些法律-行政框架,并评估这种“默认值”带来的潜在风险。

核心内容

本研究对七款在美国或中国开发的大型语言模型进行了系统性审计,重点考察其在司法管辖区未明确指定情况下的行为模式。

1. 实验设计与数据规模 研究团队构建了 60 个未明确指定司法管辖区的法律-行政类提示词,分别使用英语和普通话(Mandarin Chinese)进行测试。实验设置了三种系统提示(System Prompt)条件,共收集了 2,520 个手动标注的模型回答。

2. 主要发现:语言即默认司法管辖区 研究揭示了一个显著的方向性模式:

  • 中文输入更倾向于产生针对中国的具体答案。
  • 英语输入更倾向于产生针对美国的具体答案,或者是比较性、通用的答案。

3. 数据量化分析 在要求模型给出单一确定答案的提示词中,这种司法管辖区的选择倾向更加强烈。汇总所有模型的数据显示:

  • 74.5% 的英语输入回答采用了美国框架。
  • 53.3% 的中文输入回答采用了中国框架。

这一方向性模式在所有被测试的七款模型中均一致出现,表明这并非个别模型的偏差,而是部署层面的普遍现象。

4. 概念定义:制度框架误选风险(Institutional-Framework MisSelected Risk) 研究者将这种部署层面的模式定义为“制度框架误选风险”。其核心危害在于:模型可能给出一个流畅且看似专业的回答,但该回答所依据的法律-行政背景是用户并未意图适用的。这种情况在用户的首选语言与相关司法管辖区不一致时尤为危险。

5. 改进建议 研究指出,LLM 的界面设计不应仅凭输入语言来路由(Route)制度性建议。当用户提示中缺失地理位置信息时,模型应当:

  • 主动请求用户明确其所在司法管辖区;
  • 或者明确声明其回答所基于的司法管辖区范围。

关键要点

  • 默认值偏差存在:多语言 LLM 在缺乏明确地理信息时,倾向于根据输入语言自动匹配特定的司法管辖区(英语->美国,中文->中国)。
  • 高风险场景:在税收、劳动法、医疗等强监管领域,这种默认匹配可能导致用户依据错误的法律框架做出决策,造成实质性损害。
  • 普遍性现象:该偏差在七款不同模型中均被观察到,说明这是当前多语言大模型架构或训练数据分布中的系统性问题,而非单一模型的 Bug。
  • 中文用户的特定风险:对于使用中文但身处非中国司法管辖区(如海外华人)的用户,模型更有可能提供不符合当地法律的答案(约 53.3% 的概率套用中国框架),这构成了显著的合规与安全盲区。
  • 交互设计缺陷:当前的 LLM 接口缺乏必要的“地理确认”机制,未能将语言偏好与法律适用性解耦。

意义与影响

1. 对 AI 安全与合规的挑战 这项研究揭示了多语言大模型在垂直领域应用中的深层安全隐患。传统的“多语言支持”往往被理解为翻译能力的提升,但本研究指出,多语言模型实际上携带了隐性的“文化-法律预设”。在金融、法律、医疗等专业领域,这种预设可能导致严重的合规风险。

2. 对模型训练与对齐的启示 开发者和研究人员需要重新审视多语言数据的处理方式。仅仅增加多语言语料库并不足以解决司法管辖区混淆问题。未来的模型对齐(Alignment)工作可能需要引入更复杂的上下文感知机制,或者在训练阶段明确区分“语言风格”与“事实/法律背景”。

3. 产品设计与用户体验 对于 LLM 产品提供商而言,这篇论文提出了明确的产品改进方向:

  • 主动澄清:当检测到用户询问涉及具体法规的问题且未提供位置信息时,系统应强制弹出位置选择或确认对话框。
  • 透明化声明:在回答中明确标注所依据的法律体系(例如:“以下建议基于美国联邦法律...”),避免用户产生误解。

4. 学术研究的延伸 该研究为“语言相对论”在 AI 领域的延伸提供了实证支持。它表明,语言不仅是交流工具,在 AI 系统中,它还被赋予了定义现实框架(如法律、行政)的权力。这为后续研究语言如何塑造 AI 对世界认知的逻辑提供了新的切入点。

查看原文 →arxiv.org