技术博客arXiv cs.AI·4 小时前

结合大模型解释性的深度强化学习自动驾驶框架

原标题：An LLM-Explainable DRL Framework for Passenger-Directed Autonomous Driving

速览

该研究提出一种结合深度强化学习（DRL）与大语言模型（LLM）的自动驾驶框架，旨在解决决策不透明导致的信任问题。DRL代理负责执行快速、舒适等不同驾驶模式，LLM模块则负责解读乘客请求并生成安全导向的解释。实验表明，该框架在平衡安全性、适应性与可解释性方面表现有效，尤其在因安全限制需延迟或覆盖请求时作用显著。

AI 深度解读

面向乘客导向自动驾驶的 LLM 可解释 DRL 框架

背景

自动驾驶汽车（Autonomous Vehicles, AVs）在提升出行安全性与效率方面展现出巨大潜力，但公众对其信任度依然有限。这种信任缺失的核心原因在于自动驾驶系统在决策过程中的“黑盒”特性——缺乏透明度。当车辆做出紧急制动、变道或加速等关键操作时，乘客往往无法理解其背后的逻辑，从而产生焦虑或不信任感。

为了解决这一人机交互中的信任危机，研究人员开始探索将人工智能的可解释性引入自动驾驶领域。与此同时，深度强化学习（Deep Reinforcement Learning, DRL）在自适应驾驶控制方面取得了显著进展，而大语言模型（LLM）则在自然语言理解和生成方面表现出卓越能力。本文提出了一种结合这两者的新框架，旨在通过 LLM 向乘客解释 DRL 代理（Agent）的行为，从而在保障安全的前提下，增强系统的透明度与可接受度。

核心内容

本研究提出并验证了一个名为“LLM 可解释 DRL 框架”的概念证明（Proof of Concept）。该框架的核心目标是将 DRL 的决策能力与 LLM 的解释能力相结合，以响应乘客的特定驾驶偏好，并生成相应的行为解释。

1. 驾驶控制模块：基于 DRL 的自适应驾驶

研究团队在仿真环境中训练了 DRL 代理，采用 Dueling Double Deep Q-Network (Dueling DDQN) 算法。该模块负责执行具体的驾驶控制任务，能够响应三种截然不同的驾驶请求模式：

Fast（快速）：优先追求通行效率。
Comfort（舒适）：优先追求乘坐平稳性。
Stop（停车/等待）：优先确保安全或响应特定停车指令。

实验结果显示，该 DRL 代理展现了稳定的学习能力，能够严格遵守交通规则，并且在单次行程中可靠地在不同模式之间进行切换。

2. 可解释性模块：基于 LLM 的行为解读

为了弥补 DRL 决策不透明的缺陷，研究引入了 LLM 模块作为“解释器”。该模块具备以下功能：

意图理解：解析乘客发出的驾驶请求（如“我想快点到”或“开稳一点”）。
触发机制：判断何时需要生成解释（例如，当系统决定偏离乘客的常规偏好以符合安全约束时）。
生成解释：生成简洁、以安全为导向的行为理由。

3. 框架协同与实验结果

该框架作为一个整体，展示了强化学习（RL）决策与 LLM 解释之间的集成潜力。实验结果表明：

系统在安全性、适应性和可解释性之间取得了良好的平衡。
最显著的效果出现在冲突场景：当乘客的请求因安全约束而被延迟或覆盖时（例如，乘客要求快速通过，但系统检测到前方危险而选择减速），LLM 能够生成令人信服的解释，说明为何系统采取了与乘客即时需求相悖但更安全的操作。

关键要点

技术架构创新：首次将 Dueling DDQN 用于处理多模式驾驶请求，并并行集成 LLM 模块进行实时行为解释，形成了“决策+解释”的双引擎架构。
多模式驾驶能力：DRL 代理不仅限于单一驾驶风格，而是能够在“快速”、“舒适”和“停车”三种模式间稳定切换，且符合交通法规。
LLM 的角色定位：LLM 在此框架中并非直接参与驾驶控制，而是作为“沟通桥梁”，负责将复杂的 RL 决策转化为乘客易懂的自然语言理由，特别是针对安全相关的决策调整。
信任建立的契机：研究发现，该框架在“请求被拒绝或修改”的场景下效果最佳。这意味着，当自动驾驶系统出于安全考虑违背乘客意愿时，LLM 提供的透明解释是重建乘客信任的关键。
概念验证性质：目前该成果主要作为概念验证（Proof of Concept），证明了 RL 与 LLM 在自动驾驶领域集成的可行性，重点在于平衡安全、适应性与可解释性。

意义与影响

这项研究对自动驾驶技术的发展具有重要的理论和实践意义：

破解“信任黑盒”难题：通过引入 LLM 生成自然语言解释，本研究为解决自动驾驶“黑盒”决策带来的公众信任危机提供了一条新路径。它表明，技术上的安全不仅取决于算法本身，还取决于用户能否理解这些安全决策。
人机协作的新范式：传统的自动驾驶往往将乘客视为被动接受者。该框架允许乘客通过自然语言指令参与驾驶决策（如选择舒适或快速模式），体现了“乘客导向”（Passenger-Directed）的交互理念，提升了用户体验的个性化程度。
安全与体验的平衡：研究强调了在安全约束下对乘客请求进行合理干预的重要性。LLM 的解释功能使得这种“干预”不再是冷冰冰的系统报错，而是有理由、可沟通的安全保障，有助于减少乘客因误解而产生的恐慌或投诉。
未来研究方向：虽然目前基于仿真环境，但该框架为后续在真实车辆中部署混合智能系统（Hybrid AI Systems）奠定了基础。未来的工作可能涉及更复杂的交通场景、多模态解释（如结合视觉反馈）以及更精细的个性化偏好学习。

总之，这项工作展示了大语言模型在增强强化学习系统透明度方面的巨大潜力，为构建更安全、更透明、更受用户信赖的自动驾驶系统提供了重要的技术参考。

查看原文 →arxiv.org