← 返回信息流
AI 资讯雷峰网·1 天前

ICRA 2026开幕:具身智能转向物理智能,VLA与灵巧操作成焦点

原标题:雷峰网现场直击,ICRA 2026开幕全景解码!

速览

ICRA 2026在维也纳开幕,主题聚焦“物理智能”,VLA模型与灵巧操作技术成为核心叙事。大会显示具身智能正从纯视觉向触觉反馈与合成数据驱动转型,产业化路线清晰。同时,宇树、OpenAI等巨头动态密集,中国企业在人形机器人赛道表现活跃。

AI 深度解读

背景

IEEE国际机器人与自动化会议(ICRA)被誉为全球机器人学界的“奥林匹克”。2026年6月1日至5日,ICRA 2026在奥地利维也纳正式拉开帷幕。本届大会以“Robots for All”为主题,汇聚了来自86个国家和地区的超过8000名学者与产业人士。

从数据层面看,本届大会的学术门槛显著提升:有效投稿达4947篇,最终录用1882篇,录用率为38.04%。相较于三年前,投稿量增幅超过50%。大会共设有153场Workshop,覆盖具身智能、VLA(Vision-Language-Action)、Sim-to-Real等前沿方向,并包含20项竞赛提案。如果说去年的核心关键词是“大模型”,那么今年ICRA的叙事已明确转向“物理智能”,标志着从感知到行动的范式转移正在真实上演。

核心内容

VLA模型:从语义理解到物理执行的范式转移

ICRA 2026被定义为“VLA时刻”,具身智能正经历底层范式的重构。VLA模型不再仅仅是给机械臂安装大模型“翻译插件”,而是开始承担理解空间几何及进行长时序规划(Long-horizon Planning)的“大脑”功能。

现场探讨呈现出强烈的跨界特征,将以往分散的RL4IL(模仿学习中的强化学习)、Act to Sense(从动作到感知)和Synthetic Data(合成数据)串联起来,核心聚焦于大模型如何跨越“从语义理解到物理执行”的断层。

针对过往VLA模型在真实接触面无法预测摩擦力、形变和刚度的致命伤,本届大会提出了明确的解法:

  1. Act to Sense机制:机器人不能仅作为被动看图说话的“二传手”,必须在“动作执行”瞬间,反向感知物理世界的微观反馈。
  2. 合成数据与扩散策略:团队转向使用由仿真环境生成的百万级泛化合成数据,并通过扩散策略(Diffusion Policy)抹平模拟与现实之间的差距。

灵巧操作:数据驱动下的产业化路线

工业展区显示,具身智能的硬件竞赛已从“展示自由度”转向“数据驱动灵巧操作”。YUBI、ProHand、Nexdata、PaXini、Sharpa等厂商不再单卖硬件,而是提供「灵巧手 + 高质量操控数据集 + 阵列式触觉传感」的成套方案。

这一转变标志着灵巧操作(Dexterous Manipulation)结束了纯硬件竞赛,进入成本和生态博弈阶段。单纯依赖视觉的方案在物理操控中遭遇精度惩罚,因为视觉无法替代接触瞬间的物理反馈。为此,行业引入了高精度触觉技术:

  • 硬件端:帕西尼(Pacini)与YUBI展示微型磁敏与柔性电阻抗复合触觉皮肤,实现亚毫米级表面纹理与刚度识别。
  • 数据端:Nexdata等服务商将带有触觉标签的多视角灵巧操作数据集标准化为商品。

这种软硬件的无缝咬合,正将灵巧手从学术界的“象牙塔耗材”转化为可规模化交付的工业品。

人形机器人竞赛:资本、巨头与初创公司的共振

6月1日被称为人形机器人赛道的“超级星期一”,产业界密集事件对学术界形成倒逼:

  1. 宇树科技:科创板IPO申请获上交所上市委审议通过,73天“闪电”过会,刷新中国科技企业IPO纪录。
  2. 英伟达:CEO黄仁勋在GTC Taipei官宣与宇树合作,推出新一代人形机器人参考设计H2+(Isaac GR00T系统),形成“芯片+模型+机器人”闭环。
  3. OpenAI:CEO奥特曼宣布OpenAI Robotics团队回归,由DALL-E灵魂人物Aditya Ramesh挂帅,释放行业估值逻辑可能被改写的信号。
  4. Booster Robotics:在ICRA舞台进行T2人形机器人全球首秀。

中国企业在现场表现活跃。天机智能携Gento系列人形机器人平台提供全栈开发工具链;高擎动力带来15kg轻量化的Mini Pi plus开源平台;苏昊创立的Hillbot也进行了全球首秀。现场展示重点从平地行走转向动态干扰环境下的“抗压测试”,全身操控(WBC)实现质变,人形机器人在高动态步态行进中仍能稳定执行动态插拔等复合任务。

学术前沿:国内学者的底层技术突围

在行业迷信端到端大模型的黑盒解决方案时,中国学者提供了冷静且务实的底层技术视角:

  1. 王贺升教授(上海交通大学):聚焦视觉伺服与动态操控的数学确定性。针对端到端大模型在毫米级动态微调中不可预测和时延的问题,王教授展示了利用经典控制理论与现代深度反馈深度融合的鲁棒操控成果,解决了VLA模型在物理世界“精准对位”的工程难题。
  2. 徐天添研究员(中国科学院深圳先进技术研究院):聚焦微观尺度的自适应与多源操控进化。其团队通过数据驱动方法与精密磁场控制结合,实现了磁控微纳机器人在复杂生物流体环境中的亚微米级自主操控精度,拓展了具身智能在微纳医疗领域的应用边界。

关键要点

  • 录用率下降,门槛提升:ICRA 2026录用率为38.04%,三年间投稿量增幅超50%,显示学术竞争加剧。
  • 核心叙事转向:从“大模型”转向“物理智能”,重点解决从感知到行动的范式转移。
  • VLA模型进化:VLA模型从简单的语义翻译器升级为具备空间几何理解和长时序规划能力的“大脑”,并通过Act to Sense机制和合成数据解决物理交互难题。
  • 触觉成为标配:灵巧操作进入产业化阶段,触觉传感(如磁敏、柔性电阻抗)与高质量数据集成为软硬件解耦的关键,视觉方案因缺乏物理反馈而遭遇瓶颈。
  • 巨头入局与资本热潮:OpenAI Robotics团队回归、英伟达发布H2+参考设计、宇树科技快速过会IPO,标志着具身智能赛道进入资本与科技巨头深度绑定的新阶段。
  • 中国力量崛起:中国企业在人形机器人展示中占据重要席位,且王贺升、徐天添等国内学者在视觉伺服确定性控制和微纳操控领域提供关键底层技术支撑,平衡了全球技术博弈。
  • 全身操控(WBC)质变:人形机器人展示重点从基础行走转向动态干扰下的复合任务执行,如行进中插拔物体。

意义与影响

ICRA 2026清晰地表明,具身智能行业正从概念验证和纯算法竞赛,正面挺进技术深水区。

首先,技术逻辑的重构:行业共识已从“拥有大模型”转向“拥有物理智能”。VLA模型与触觉反馈、仿真数据的结合,证明了纯视觉或纯语义模型在真实物理世界中的局限性,数据驱动的软硬一体化方案成为主流。

其次,商业化路径的清晰化:灵巧手等核心部件不再作为孤立硬件销售,而是作为包含数据集和算法的成套解决方案进入生产线。这种生态重构加速了具身智能从实验室走向工业装配线和家庭环境的进程。

最后,全球竞争格局的重塑:随着OpenAI等顶级AI公司重返机器人赛道,以及中国企业在硬件制造、快速迭代和底层控制理论上的突破,全球具身智能的竞争已从单一的技术维度扩展为资本、产业链、算法确定性和应用场景的全方位博弈。中国学者在基础控制理论和微观操控领域的贡献,也为全球行业提供了摆脱“黑盒”依赖、追求工程确定性的另一种范式。

查看原文 →leiphone.com