Can LLMs Imagine Moral Alternatives Beyond Binary Dilemmas?
AI 深度解读
背景
随着大语言模型(LLMs)越来越多地被部署为道德顾问和智能体,它们在面对两个相互冲突的价值观时,处理道德困境的能力变得至关重要。然而,现有的关于 LLMs 与道德困境的研究大多局限于“非此即彼”的二元选择框架,忽视了一个人类道德认知的核心特征:人类具备跳出给定选项、想象第三种替代方案的能力。这种认知上的缺失,使得当前基于 LLMs 的道德决策系统显得过于僵化,难以应对复杂的现实伦理场景。
核心内容
针对上述研究空白,本文提出了 MoralAltDataset。该数据集包含 307 个道德困境,涵盖了叙事性 Advisor 困境和面向 AI 的 Agent 困境。与传统的二元困境不同,该数据集中的每个困境都额外补充了“妥协”和“重构”两种替代方案。
研究首先探讨了当引入这些替代方案时,人类和 LLMs 的道德判断是否会发生转变。实验涵盖了 15 个 LLMs,结果表明,妥协替代方案往往比任何一个原始选项都更受青睐,
查看原文 →arxiv.org
