← 返回信息流
AI 资讯雷峰网·3 天前

ICRA 2026接收VPP-TC:基于可行性理论的被动力矩安全控制框架

原标题:ICRA 2026 | VPP-TC: 基于可行性理论的被动力矩安全控制框架

速览

本文提出VPP-TC框架,基于可行性理论在增广状态空间中预计算安全集合,将约束转化为关节加速度的仿射约束。该方法无需计算二阶导数,通过二次规划实时求解,确保机器人在物理人机交互中的安全性。实验表明,相比基于控制屏障函数的基线方法,VPP-TC具有更高的控制频率、更平滑的轨迹和更短的路径。

AI 深度解读

ICRA 2026 | VPP-TC:基于可行性理论的被动力矩安全控制框架深度解读

背景

在物理人机交互(pHRI)场景中,机器人需要在与人类近距离协作时保持被动性(Passivity),即吸收的能量不少于释放的能量,从而保证在外部扰动下的鲁棒性和稳定性。经典的阻抗/导纳控制框架、Port-Hamiltonian 方法以及基于动力系统(DS)的被动力矩控制器已被广泛研究。

然而,这类被动控制器通常缺乏显式的约束处理能力,无法保证在整个任务执行过程中的碰撞避免和关节限位满足。先前工作 CPIC 利用控制屏障函数(CBF)框架和指数控制屏障函数(ECBF)来约束被动力矩控制器,但存在以下局限性:

  1. 硬约束冲突:硬约束之间可能互相冲突,导致二次规划(QP)不可行;
  2. 死锁风险:QP 框架易陷入死锁和关节空间的局部最小值;
  3. 计算负担重:ECBF 需要计算边界函数的 Hessian 矩阵(二阶导数),当边界由神经网络表示时,实时性难以保证。

正是这些局限性,促使宾夕法尼亚大学机器人学硕士生张子哲(第一作者)及其导师 Nadia Figueroa 教授团队提出了基于**可行性理论(Viability Theory)**的全新安全控制框架 VPP-TC(Viability-Preserving Passive Torque Control)。该工作获得了 IROS 2025 两个 Workshop 的双料最佳论文奖,并被 ICRA 2026 录用。

核心内容

VPP-TC 的核心创新在于:在关节位置 $q$ 和关节速度 $\dot{q}$ 的增广状态空间中引入安全边界,而非仅在关节位置空间中操作。在这个增广空间中,安全约束可以直接推导为关节加速度 $\ddot{q}$ 的仿射约束,再通过机器人动力学方程转化为力矩约束。这一过程无需计算边界函数的二阶导数,从而实现了更高的控制回路频率和更平滑的轨迹。

1. 核心思想:从 CBF 到 Viability

  • 可行性定义:从可行集 $V$ 中的任意初始状态出发,存在一个控制序列(加速度序列),使得产生的无限长状态序列始终在可行集内。这比单纯的「可行(Feasible)」更强——一个可行状态可能在未来的控制下离开可行集,但一个 Viable 状态保证能永远留在安全集内。
  • 优势:通过在 $(q, \dot{q})$ 增广状态空间中操作,安全约束被表达为关于加速度的仿射函数,仅需要边界函数的一阶梯度,大幅降低了计算负担。

2. 自碰撞避免约束(SCA)

  • 保守定义:如果从当前状态出发,以最大减速反向制动至完全停止的整条制动轨迹上都不发生自碰撞,则认为该状态是自碰撞安全的。
  • 数据驱动学习:使用基于 Transformer 的神经网络分类器 $\Gamma(q, \dot{q})$ 学习可行集。
    • 训练数据:通过仿真生成 300 万组 $(q, \dot{q})$ 状态对,模拟制动过程并标注(若制动轨迹无自碰撞则标为 Viable,否则标为 Non-viable)。
    • 网络架构:标准 Transformer-Encoder 架构(前馈维度 128、2 个注意力头、4 层堆叠),训练 30 个 epoch,测试集准确率达 99.27%,召回率达 99.74%。
  • 约束实施:通过 Taylor 展开将 $\Delta\Gamma(q, \dot{q}) \ge 0$ 线性化为关于 $\ddot{q}$ 的仿射约束,再通过动力学方程转化为力矩约束。关键公式涉及边界函数 $\Gamma$ 对 $q$ 和 $\dot{q}$ 的一阶梯度与时间步长。

3. 外部障碍物碰撞避免约束(ECA)

  • 几何编码:采用 Bernstein 多项式 表示的符号距离函数(SDF)编码每个机器人连杆的几何。
  • 可行性保持 SDF:定义为制动轨迹上的最小瞬时 SDF:$S_v (p, q_0, \dot{q}0) = \min{t\in[0,T_br]} S (p, q (t))$。
  • 动态障碍物支持:通过 Taylor 展开得到关于 $\ddot{q}$ 的仿射约束。值得注意的是,该约束通过 $\Delta p$ 项隐式地纳入了障碍物速度信息,因此 VPP-TC 天然具备处理动态障碍物的能力。

4. 关节位置与速度限位约束

  • 受 Del Prete (2018) 启发,通过解析推导获得关节加速度的上下界 $\ddot{q}{lb}$ 和 $\ddot{q}{ub}$,取位置可行性约束、速度约束和硬件加速度限制的交集,再通过动力学方程转化为力矩约束。

5. 统一的 QP 控制框架

  • 将所有约束统一到一个二次规划(QP)问题中:
    • 目标函数:最小化实际力矩与名义被动控制器力矩的偏差。
    • 约束条件:包括关节限位(始终激活)、自碰撞约束(靠近边界时激活)、外部碰撞约束(靠近边界时激活)和力矩硬件限制。
    • 可行性保证:外部碰撞约束通过松弛变量软化以保证 QP 可行性。

关键要点

  • 无需二阶导数:通过在 $(q, \dot{q})$ 增广状态空间中操作,安全约束被表达为关于加速度的仿射函数,仅需要边界函数的一阶梯度。这大幅降低了计算负担,是实现高控制频率的关键。
  • 统一框架处理多类约束:关节限位、自碰撞、外部碰撞三类约束在同一 QP 中统一处理,约束按需激活,框架简洁优雅。
  • 天然支持动态障碍物:外部碰撞约束的 Taylor 展开中包含障碍物位移 $\Delta p$ 项,隐式编码了障碍物速度,无需额外处理即可应对动态环境。
  • 全身碰撞避免:得益于 Bernstein 多项式 SDF 的高效计算,VPP-TC 能考虑所有机器人连杆的几何,而非像 CPIC 那样仅考虑末端几个连杆。
  • 被动性保证:即使在约束激活时,控制器输出的力矩仍保持任务空间被动性 —— 约束反作用力要么被阻尼耗散,要么被约束反力吸收,不向环境注入净能量。
  • 性能优势:相比基于 CBF 的基线方法 CPIC,VPP-TC 控制回路频率提升 1.4–2.4 倍,轨迹更平滑、路径更短,轨迹抖动降低了一个数量级以上。

意义与影响

VPP-TC 为被动力矩控制的安全性问题提供了一套优雅而高效的解决方案。它将可行性理论与数据驱动学习相结合,在增广状态空间中构建安全集合,并通过 QP 实时求解力矩约束。

  1. 学术价值:该工作解决了传统 CBF 方法在实时性和约束冲突上的痛点,证明了在增广状态空间中利用可行性理论处理安全约束的有效性。其获得 IROS 2025 双料最佳论文奖及 ICRA 2026 录用,充分体现了其学术认可度。
  2. 应用潜力:对于关注人机交互安全、力矩控制以及机器人安全保障的研究者而言,这是一篇值得深入研读的工作。特别是在需要高实时性、全身碰撞避免以及动态环境适应性的物理人机协作场景中,VPP-TC 展示了巨大的应用前景。
  3. 未来方向:当前框架假设精确的动力学模型。作者计划在未来工作中考虑有界的模型不确定性,设计在建模误差下仍能保证可行性的鲁棒控制器。
查看原文 →leiphone.com