ICRA 2026首日:5篇最佳论文入围,灵巧手与VLA成焦点
速览
ICRA 2026大会首日揭晓5篇Best Paper Award Finalist,涵盖机器人学习、操控及规划控制三大方向,GRASP Lab贡献两篇。灵巧手赛道竞争加剧,Xynova、Rysen及Wuji Hand 2展示不同技术路线。VLA在接触任务中的性能解析及Yunzhu Li团队的real-to-sim-to-real研究引发学界高度关注。
AI 深度解读
背景
ICRA 2026(IEEE International Conference on Robotics and Automation)作为机器人学领域的顶级学术会议,其2026年大会在维也纳举行。本届大会吸引了7600多位注册学者参与,中国展商成为首日(Day 1)最引人注目的存在。Shohei Hido 甚至直言“China is dominating”,反映了中国团队在机器人领域的强劲影响力。
大会首日不仅公布了备受瞩目的最佳论文候选名单,还通过主题演讲和展览展示了多个前沿技术方向的突破,特别是灵巧手硬件竞赛、VLA(视觉-语言-动作)模型的底层逻辑解析,以及机器人学习在接触任务和运动控制方面的最新进展。
核心内容
1. 最佳论文 Finalist 揭晓:ICRA 2026 首次公开论文评级
本届 ICRA 首次对会议论文进行公开评级,公布了5篇 Best Paper Award Finalists,涵盖机器人学习、操控与移动、规划与控制三大方向。
- FP3 (Robot Learning):由 Geng Chen 教授团队提出。该研究聚焦机器人学习领域的核心问题,以创新方法论在众多投稿中脱颖而出,成为首日学界瞩目的焦点。
- Push Anything (Manipulation & Locomotion):由宾夕法尼亚大学 GRASP 实验室与 DAIR Lab 联合提出。研究聚焦极端非结构化环境下的机器人推动策略,在物体种类、地面材质、接触形态等方面展现出极强的泛化能力。
- Symskill (Planning & Control):同样来自 GRASP 实验室。该论文聚焦对称性技能学习在规划中的应用,与 Push Anything 共同见证了 GRASP 实验室在本届 ICRA 的统治力。
- HITTER (硬件+算法结合):一款乒乓球机器人,在 Hall A2 展出。HITTER 以极高速度与精度的球拍控制惊艳全场,被视为本届硬件与算法结合最出彩的作品之一。
2. 灵巧手赛道:三足鼎立的产业竞赛
Day 1 展览区传递出“给机器人装上灵魂”的强烈信号,三条技术路线正面碰撞,标志着灵巧操控从实验室研究正式进入产业竞赛阶段。
- Xynova Flex 2:采用气动与线驱混合驱动方案,尺寸接近人手,动作流畅自然。它是首日展览区互动率最高的单品,成为本期物理产品的流量担当。
- Rysen Robotics Apex Hand:凭借 10kg 的单手握持力获得行业外关注,甚至被加密货币媒体 Cointelegraph 主动报道。其纯电机驱动方案对标工业级应用场景,出圈信号明显。
- Wuji Hand 2:创始人潘云喆在 Dexterous Manipulation Workshop 分享第二代灵巧手进展,明确开源生态战略。与 Xynova 和 Rysen 的硬件竞赛不同,Wuji 选择以开放平台切入,试图建立社区壁垒,为研究者和开发者提供低成本实验入口。
此外,Apex Glove 触觉反馈 VR 遥操作手套和 Touchlab TACTO 触觉指尖新品也展示了该领域的多元化发展。
3. VLA 路线深水区:解构接触任务中的性能来源
VLA(视觉-语言-动作)是本届大会的高频词,但直到 Day 1 才有人给出硬核的理论解释。
- Jeannette Bohg 的主题演讲:斯坦福/华盛顿大学的 Jeannette Bohg 教授发表了题为《Demystify VLA Performance in Contact-Rich Tasks》的演讲。她系统剖析了 Diffusion Policy 与 VLA 在面对接触丰富任务时的高性能来源,关键洞察在于这些模型在无需力传感器的情况下,如何隐式编码了接触动力学。这场演讲被视为对 VLA 后续研究具有标杆意义的“教科书级”解析。
- Yunzhu Li 团队的全链路研究:Yunzhu Li 团队展示了 real-to-sim-to-real(真实到仿真再回到真实)的多项成果,覆盖软体机器人建模、触觉仿真、可微分物理等前沿交叉领域,刷新了个人帖点赞记录,反映了学界对跨域迁移研究的高度关注。
- AMPLIFY 的数据创新:Jeremy Collins 团队提出利用互联网海量人类操作视频(如 YouTube 视频)训练机器人策略。通过创新的数据筛选与动作映射机制,将非结构化视频转化为机器人可用的训练信号,直击机器人学习领域的数据瓶颈痛点。
- Flexible Locomotion with Diffusion MPC:Runhan Huang 和 Yilun Du 团队将扩散模型与模型预测控制(MPC)深度融合,实现了四足、轮式、人形等不同机器人形态间的快速运动策略迁移,展现了极强的跨形态泛化能力。
关键要点
- 首次评级:ICRA 2026 首次公开 Best Paper Award Finalists,GRASP Lab 贡献两篇(Push Anything, Symskill),Geng Chen 教授的 FP3 在 Robot Learning 方向表现突出。
- 中国力量:中国展商在首日成为最醒目的存在,Shohei Hido 评价“China is dominating”。
- 灵巧手三强:
- Xynova Flex 2:气动+线驱混合驱动,追求人手级尺寸与流畅度。
- Rysen Apex Hand:10kg 握力,纯电机驱动,对标工业场景,引发跨圈层关注。
- Wuji Hand 2:主打开源生态,旨在建立低成本实验入口和社区壁垒。
- VLA 理论突破:Jeannette Bohg 揭示了 VLA 和 Diffusion Policy 在无需力传感器情况下处理接触任务的隐式动力学编码机制。
- 数据与仿真:
- AMPLIFY 利用互联网视频数据解决机器人学习数据瓶颈。
- Yunzhu Li 团队展示了完整的 real-to-sim-to-real 研究链路。
- Diffusion MPC 实现了跨形态(四足、轮式、人形)的运动策略快速迁移。
- 硬件展示:HITTER 乒乓球机器人凭借高速度与精度成为硬件+算法结合的典范。
意义与影响
ICRA 2026 首日的内容标志着机器人技术正在从单一的性能指标竞争,转向更复杂的系统工程和生态构建。
- 学术评价体系的规范化:首次公开最佳论文候选名单,增强了学术透明度和关注度,也为研究者提供了明确的阅读指引。
- 灵巧手产业的成熟:Xynova、Rysen 和 Wuji 分别代表了混合驱动高性能、工业级高握力、开源生态三种不同的商业化路径,表明灵巧手已不再是纯学术玩具,而是具备了明确的产业落地场景和竞争格局。
- VLA 从概念走向工程现实:Jeannette Bohg 的演讲为 VLA 在接触任务中的有效性提供了理论支撑,消除了部分疑虑。同时,AMPLIFY 和 Yunzhu Li 的工作展示了如何利用现有数据资源(互联网视频、仿真)来加速机器人学习,解决了数据稀缺和仿真到现实迁移的核心痛点。
- 通用机器人能力的提升:Diffusion MPC 的跨形态泛化能力表明,机器人运动控制正在向更通用的方向发展,不再局限于特定形态的专用控制,这为通用机器人的实现提供了新的技术蓝图。
总体而言,ICRA 2026 Day 1 展示了机器人学在感知、决策、执行全链条上的快速进步,特别是中国在硬件创新和学术贡献上的主导地位日益凸显。
