← 返回信息流
AI 资讯雷峰网·3 小时前

ICRA 2026:中国军团主导维也纳,具身智能迈向物理智能深水区

原标题:ICRA 2026 现场:中国军团主导维也纳,新锐巨头混战具身智能深水区

速览

ICRA 2026在维也纳召开,中国展商在核心展区占据主导地位,被学者评价为“China is dominating”。本届大会叙事从大模型转向物理智能,中国企业在VLA算法、具身基座模型及硬件本体端均呈现强势竞争力。同时,灵巧操作进入数据驱动的商业化量产阶段,全球机器人产业版图正被中国企业改写。

AI 深度解读

背景

IEEE国际机器人与自动化会议(ICRA 2026)于2026年6月1日至5日在奥地利维也纳举行,主题为“Robots for All”(机器人服务于所有人)。作为全球机器人学界一年一度的“奥林匹克”,本届大会汇聚了来自86个国家和地区的超过8000名学者与产业人士。数据显示,本届ICRA有效投稿达4947篇,最终录用1882篇,录用率为38.04%。其中,中国高校表现强劲,11所中国高校占据Top 20榜单的55%,清华大学以74篇论文断层第一,“清北交浙”四校合计贡献212篇。

与往年不同,本届ICRA的核心叙事已从去年的“大模型”明确转向“物理智能”。在从感知到行动的范式转移中,中国企业不仅在硬件本体端呈现“诸神混战”的盛况,更在算法顶层展现出强大的生态压制力,正在以前所未有的力度改写全球机器人产业版图。

核心内容

1. VLA模型成为核心焦点,中国军团实现全链条突围

今年ICRA围绕VLA(Vision-Language-Action,视觉-语言-动作)模型展开的探讨呈现出强烈的跨界收敛特征。全行业试图跨越“从语义理解到物理执行”的断层,将以往散落的RL4IL(模仿学习中的强化学习)、Act to Sense(从动作到感知)和Synthetic Data(合成数据)串联起来。

  • 算法顶层: 中国大模型强势冲顶。千寻智能展示了自研具身基座模型Spirit v1.6,并在行业盲测中力压英伟达Cosmos3与Physical Intelligence的Pi0.5,霸榜全球第一。这表明中国VLA模型已具备处理极度依赖动态力量控制的柔性动作(如“串糖葫芦”)的能力。
  • 硬件本体: 呈现百花齐放态势。除了明星初创Booster Robotics全球首秀T2人形机器人,知名学者苏昊创立的苏度科技也进行了最新机器人首发。老牌劲旅天机智能以铂金合作伙伴身份展示Gento系列人形机器人平台,提供从遥操作到具身智能的全栈开发工具链。高擎动力则推出15kg轻量化机身的Mini Pi plus开源人形平台,旨在填补科研端高性价比生态空白。

2. 技术范式转移:从“指令翻译机”到“物理中枢”

中国军团之所以能跑出加速度,关键在于啃下了“物理法则”的硬骨头。过去,纯视觉和仿真的VLA模型在真实物理表面存在“阿喀琉斯之踵”,无法精准预测摩擦力、形变和刚度。

今年被挤爆的“Act to Sense”论坛给出了明确解法:具身智能不能仅作为被动看图说话的“指令翻译机”,机器人必须在“动作执行(Act)”的交互瞬间,反向捕捉并适应物理世界的微观反馈(Sense)。随着百万级泛化合成数据的大规模引入,以及扩散策略(Diffusion Policy)对虚实差异(Sim-to-Real)的有效抹平,VLA模型开始承担起理解三维空间几何、主导长时序规划(Long-horizon Planning)的完整中枢功能。

3. 产业信号密集释放,全球板块发生漂移

开幕当天,四件标志性事件密集发生,标志着具身智能赛道进入新阶段:

  • 宇树科技: 科创板IPO申请获上交所上市委审议通过,73天“闪电”过会,刷新中国科技企业IPO纪录。
  • 英伟达: CEO黄仁勋在GTC Taipei官宣与宇树合作推出新一代人形机器人参考设计H2+(Isaac GR00T系统),形成“芯片+模型+机器人”三位一体的产业闭环。
  • OpenAI: CEO奥特曼宣布OpenAI Robotics团队回归,由DALL-E灵魂人物Aditya Ramesh挂帅,释放了行业估值逻辑可能被改写的强烈信号。
  • Booster Robotics: 选择ICRA舞台进行T2人形机器人全球首秀。

这种全球范围内的板块漂移导致ICRA现场的展示不再满足于静态行走,而是被拉入动态干扰环境进行“抗压测试”。全身操控(Whole-Body Control, WBC)迎来工程学质变,人形机器人在保持高动态步态的同时,上肢双手能稳定执行动态插拔、搬运等复合任务。

4. 工业展区:灵巧操作进入“数据驱动”时代

软件层面的大模型数据焦虑,在工业展区找到了硬件镜像。过去单纯展示自由度的孤立机械手退出主舞台,取而代之的是“数据驱动灵巧操作”的产业路线。

  • 成套方案对垒: 帕西尼、Sharpa等展商不再单卖硬件,而是以「灵巧手 + 高质量操控数据集 + 阵列式触觉传感」的成套方案参展。这标志着灵巧操作(Dexterous Manipulation)已结束“能不能抓起杯子”的纯硬件竞赛,进入成本和生态博弈阶段。
  • 触觉感知的关键作用: 单纯依赖视觉模型在物理操控中正遭遇精度惩罚。帕西尼与YUBI展示的微型磁敏与柔性电阻抗复合触觉皮肤,能提供亚毫米级的表面纹理与刚度识别。千觉科技CTO赵浩南指出,触觉传感器是解决装配、插拔等精细操作“最后一毫米”问题的关键。
  • 数据闭环成型: 从触觉感知到动捕采集,一条“光学捕捉+触觉传感+灵巧执行”的完整数据闭环正在中国展商中悄然成型。例如,Sharpa与英伟达合作在Isaac平台做simulation preload,并结合真机+Manus数据手套采集数据;度量科技的光学动捕系统则为灵巧手训练提供高精度轨迹数据。

5. 华人学者贡献硬核技术突破

中国学者与海外华人军团在核心议程中扮演了行业平衡器角色,提供了冷静且务实的研究视角:

  • 王贺升教授(上海交通大学): 在视觉伺服领域,他坚持严谨路径,对抗“端到端大模型”的唯技术论狂热。其团队提出了可变形三维高斯地图(3DGS)与连续性约束定位方法,解决了人体组织等“非刚体”环境下的感知难题,并将NeRF记忆机制与VLM推理能力融合,构建下一代导航规划框架。相关技术已落地于矿卡、仓储机器人等场景。
  • 徐天添研究员(中国科学院深圳先进技术研究院): 聚焦磁控微纳机器人在生物医疗工程中的应用。通过数据驱动方法与精密磁场控制的结合,实现了亚微米级的自主操控精度,证明了物理智能在微纳医疗领域的精细延伸是一条能实质性改变人类生命质量的硬核赛道。

关键要点

  • 中国主导地位确立: 中国展商成为本届ICRA最醒目的存在,被日本学者Shohei Hido感叹为“China is dominating”。
  • 技术范式转移: 行业核心从“大模型”转向“物理智能”,VLA模型成为连接语义理解与物理执行的桥梁。
  • 中国模型霸榜: 千寻智能Spirit v1.6在盲测中超越英伟达Cosmos3和PI Pi0.5,成为第一梯队中最耀眼的中国大脑。
  • 硬件生态普惠: 中国硬件厂商从“提供躯干”转向全栈能力输出,天机智能、高擎动力等提供高性价比、开源或全栈工具链方案。
  • 触觉感知至关重要: 视觉存在局限,触觉传感器成为解决精细操作“最后一毫米”的关键,帕西尼、Sharpa等推动触觉数据闭环商业化。
  • 资本与巨头共振: 宇树科技IPO过会、英伟达发布参考设计、OpenAI回归机器人赛道,共同推动行业估值逻辑重构。
  • 学术与产业融合: 王贺升、徐天添等学者的研究展示了从宏观导航到微观医疗的硬核技术突破,为行业注入清醒的技术理性。

意义与影响

ICRA 2026清晰地表明,具身智能行业正在向技术深水区正面挺进。

首先,全球机器人产业格局被重塑。中国不再仅仅是硬件代工厂,而是在算法顶层、硬件本体、数据闭环等全链条上展现出强大的生态压制力,正在重新定义全球具身智能的竞赛规则。

其次,**商业化路径

查看原文 →leiphone.com