AI 资讯雷峰网·3 天前

ICRA 2026接收VPP-TC：基于可行性理论的被动力矩安全控制框架

原标题：ICRA 2026 | VPP-TC: 基于可行性理论的被动力矩安全控制框架

速览

本文提出VPP-TC框架，基于可行性理论在增广状态空间中预计算安全集合，将约束转化为关节加速度的仿射约束。该方法无需计算二阶导数，通过二次规划实时求解，确保机器人在物理人机交互中的安全性。实验表明，相比基于控制屏障函数的基线方法，VPP-TC具有更高的控制频率、更平滑的轨迹和更短的路径。

AI 深度解读

ICRA 2026 | VPP-TC：基于可行性理论的被动力矩安全控制框架深度解读

背景

在物理人机交互（pHRI）场景中，机器人需要在与人类近距离协作时保持被动性（Passivity），即吸收的能量不少于释放的能量，从而保证在外部扰动下的鲁棒性和稳定性。经典的阻抗/导纳控制框架、Port-Hamiltonian 方法以及基于动力系统（DS）的被动力矩控制器已被广泛研究。

然而，这类被动控制器通常缺乏显式的约束处理能力，无法保证在整个任务执行过程中的碰撞避免和关节限位满足。先前工作 CPIC 利用控制屏障函数（CBF）框架和指数控制屏障函数（ECBF）来约束被动力矩控制器，但存在以下局限性：

硬约束冲突：硬约束之间可能互相冲突，导致二次规划（QP）不可行；
死锁风险：QP 框架易陷入死锁和关节空间的局部最小值；
计算负担重：ECBF 需要计算边界函数的 Hessian 矩阵（二阶导数），当边界由神经网络表示时，实时性难以保证。

正是这些局限性，促使宾夕法尼亚大学机器人学硕士生张子哲（第一作者）及其导师 Nadia Figueroa 教授团队提出了基于**可行性理论（Viability Theory）**的全新安全控制框架 VPP-TC（Viability-Preserving Passive Torque Control）。该工作获得了 IROS 2025 两个 Workshop 的双料最佳论文奖，并被 ICRA 2026 录用。

核心内容

VPP-TC 的核心创新在于：在关节位置 $q$ 和关节速度 $\dot{q}$ 的增广状态空间中引入安全边界，而非仅在关节位置空间中操作。在这个增广空间中，安全约束可以直接推导为关节加速度 $\ddot{q}$ 的仿射约束，再通过机器人动力学方程转化为力矩约束。这一过程无需计算边界函数的二阶导数，从而实现了更高的控制回路频率和更平滑的轨迹。

1. 核心思想：从 CBF 到 Viability

可行性定义：从可行集 $V$ 中的任意初始状态出发，存在一个控制序列（加速度序列），使得产生的无限长状态序列始终在可行集内。这比单纯的「可行（Feasible）」更强——一个可行状态可能在未来的控制下离开可行集，但一个 Viable 状态保证能永远留在安全集内。
优势：通过在 $(q, \dot{q})$ 增广状态空间中操作，安全约束被表达为关于加速度的仿射函数，仅需要边界函数的一阶梯度，大幅降低了计算负担。

2. 自碰撞避免约束（SCA）

保守定义：如果从当前状态出发，以最大减速反向制动至完全停止的整条制动轨迹上都不发生自碰撞，则认为该状态是自碰撞安全的。
数据驱动学习：使用基于 Transformer 的神经网络分类器 $\Gamma(q, \dot{q})$ 学习可行集。
- 训练数据：通过仿真生成 300 万组 $(q, \dot{q})$ 状态对，模拟制动过程并标注（若制动轨迹无自碰撞则标为 Viable，否则标为 Non-viable）。
- 网络架构：标准 Transformer-Encoder 架构（前馈维度 128、2 个注意力头、4 层堆叠），训练 30 个 epoch，测试集准确率达 99.27%，召回率达 99.74%。
约束实施：通过 Taylor 展开将 $\Delta\Gamma(q, \dot{q}) \ge 0$ 线性化为关于 $\ddot{q}$ 的仿射约束，再通过动力学方程转化为力矩约束。关键公式涉及边界函数 $\Gamma$ 对 $q$ 和 $\dot{q}$ 的一阶梯度与时间步长。

3. 外部障碍物碰撞避免约束（ECA）

几何编码：采用 Bernstein 多项式 表示的符号距离函数（SDF）编码每个机器人连杆的几何。
可行性保持 SDF：定义为制动轨迹上的最小瞬时 SDF：$S_v (p, q_0, \dot{q}0) = \min{t\in[0,T_br]} S (p, q (t))$。
动态障碍物支持：通过 Taylor 展开得到关于 $\ddot{q}$ 的仿射约束。值得注意的是，该约束通过 $\Delta p$ 项隐式地纳入了障碍物速度信息，因此 VPP-TC 天然具备处理动态障碍物的能力。

4. 关节位置与速度限位约束

受 Del Prete (2018) 启发，通过解析推导获得关节加速度的上下界 $\ddot{q}{lb}$ 和 $\ddot{q}{ub}$，取位置可行性约束、速度约束和硬件加速度限制的交集，再通过动力学方程转化为力矩约束。

5. 统一的 QP 控制框架

将所有约束统一到一个二次规划（QP）问题中：
- 目标函数：最小化实际力矩与名义被动控制器力矩的偏差。
- 约束条件：包括关节限位（始终激活）、自碰撞约束（靠近边界时激活）、外部碰撞约束（靠近边界时激活）和力矩硬件限制。
- 可行性保证：外部碰撞约束通过松弛变量软化以保证 QP 可行性。

关键要点

无需二阶导数：通过在 $(q, \dot{q})$ 增广状态空间中操作，安全约束被表达为关于加速度的仿射函数，仅需要边界函数的一阶梯度。这大幅降低了计算负担，是实现高控制频率的关键。
统一框架处理多类约束：关节限位、自碰撞、外部碰撞三类约束在同一 QP 中统一处理，约束按需激活，框架简洁优雅。
天然支持动态障碍物：外部碰撞约束的 Taylor 展开中包含障碍物位移 $\Delta p$ 项，隐式编码了障碍物速度，无需额外处理即可应对动态环境。
全身碰撞避免：得益于 Bernstein 多项式 SDF 的高效计算，VPP-TC 能考虑所有机器人连杆的几何，而非像 CPIC 那样仅考虑末端几个连杆。
被动性保证：即使在约束激活时，控制器输出的力矩仍保持任务空间被动性 —— 约束反作用力要么被阻尼耗散，要么被约束反力吸收，不向环境注入净能量。
性能优势：相比基于 CBF 的基线方法 CPIC，VPP-TC 控制回路频率提升 1.4–2.4 倍，轨迹更平滑、路径更短，轨迹抖动降低了一个数量级以上。

意义与影响

VPP-TC 为被动力矩控制的安全性问题提供了一套优雅而高效的解决方案。它将可行性理论与数据驱动学习相结合，在增广状态空间中构建安全集合，并通过 QP 实时求解力矩约束。

学术价值：该工作解决了传统 CBF 方法在实时性和约束冲突上的痛点，证明了在增广状态空间中利用可行性理论处理安全约束的有效性。其获得 IROS 2025 双料最佳论文奖及 ICRA 2026 录用，充分体现了其学术认可度。
应用潜力：对于关注人机交互安全、力矩控制以及机器人安全保障的研究者而言，这是一篇值得深入研读的工作。特别是在需要高实时性、全身碰撞避免以及动态环境适应性的物理人机协作场景中，VPP-TC 展示了巨大的应用前景。
未来方向：当前框架假设精确的动力学模型。作者计划在未来工作中考虑有界的模型不确定性，设计在建模误差下仍能保证可行性的鲁棒控制器。

查看原文 →leiphone.com