Long-term Traffic Simulation via Structured Autoregressive Modeling
AI 深度解读
基于结构化自回归建模的长时程交通仿真:RosettaSim 与 RTE 框架解读
背景
在自动驾驶技术的研发与验证中,交互式交通仿真扮演着“世界模型”的关键角色。它不仅能够生成逼真的驾驶场景,还能模拟复杂的交通流交互,是算法迭代和闭环测试的基础设施。然而,现有的仿真系统在长时程推演中面临两大核心痛点:一是如何持续建模多智能体之间错综复杂的交互行为;二是如何处理动态变化的 token 基数——在真实的交通场景中,车辆和行人不断进入和离开仿真视野,导致传统的基于固定维度输入的模型难以适应。
近年来,大语言模型(LLMs)在序列建模方面展现了惊人的能力,但将其直接应用于物理世界的交通仿真仍面临适配难题。本文提出的 RosettaSim 框架及其配套的 RTE 评估方法,正是为了解决长时程交通仿真中的动态交互与评估对齐问题而生。
核心内容
本文的核心主张在于:解决长时程交通仿真的关键在于利用大规模序列模型(如 LLMs)的架构归纳偏置与统计先验之间的协同作用。
研究人员的探测实验揭示了一个重要发现:注意力机制具有极强的可迁移性,且运动 token 的分布与自然语言具有内在的一致性。这意味着,即便是小规模的、绝大部分参数被冻结的 LLM,也能够快速适应交通建模任务,而无需进行全参数的重头训练。
查看原文 →arxiv.org
