雷峰网现场直击:ICRA 2026下周在维也纳开幕,中国力量站上C位
速览
IEEE ICRA 2026将于6月1日在维也纳开幕,本届大会投稿量创历史新高,VLA模型、Sim-to-Real技术及3D感知成为三大核心主线。Physical Intelligence的pi-0.5和英伟达GR00T N1展示了具身智能的最新突破。中国学者在VLA安全等前沿领域占据关键位置,标志着中国力量从参与者向规则定义者的转变。
AI 深度解读
背景
IEEE国际机器人与自动化会议(ICRA)是全球机器人领域最具影响力的顶级学术会议之一。2026年的ICRA将于6月1日至5日在奥地利维也纳举行,这是该会议历史上规模最大、竞争最激烈的一届。
本届大会共收到4947篇投稿,创下历史新高,较2023年的3300多篇增长了超过50%。来自全球86个国家和地区的学者参与了投稿,最终有1882篇论文被录用,录用率为38.04%。此外,大会还额外收录了约1000篇来自RA-L、T-RO、T-ASE等顶级期刊的论文进行展示,并设有153份Workshop和Tutorial提案以及20份竞赛提案。
大会主题为“Robots for All”(机器人惠及所有人),旨在展示机器人技术如何更广泛地服务于人类社会。在这一背景下,中国研究者的角色正从单纯的“参与者”向“规则定义者”转变,不仅在论文数量上占据重要地位,更在VLA安全、具身智能攻击面等前沿方向上进行了系统性布局。
核心内容
本届ICRA的技术风向标明确指向了VLA(视觉-语言-动作)模型的崛起。据第三方统计,VLA相关论文占全部接收论文的近20%,标志着机器人学界注意力正从传统的“规划-控制”范式大规模迁移至“端到端学习”。
在VLA及具身智能领域,几个关键项目成为了焦点:
- Physical Intelligence的pi-0.5:这是目前公开报道中首个在完全陌生家庭环境中实现长时序灵巧操作的端到端系统。该系统展现了极强的泛化能力,例如在未见过的新厨房里刷碗,或在陌生卧室里叠被子,这种能力在一年前仍被视为科幻场景。
- 英伟达(NVIDIA)的GR00T N1:展示了双系统架构路线,通过快反应模块处理底层控制,慢推理规划器负责高层决策。该模型实现了零样本迁移,即在一个平台训练的策略可直接应用于形态完全不同的其他机器人,被视为具身智能叙事中的里程碑。
除了VLA,另外两条主线同样引人注目:
- Sim-to-Real(仿真到现实)的工程化:NVIDIA Isaac Lab等仿真平台降低了门槛,使中小团队也能搭建完整的仿真流水线。结合域随机化技术,策略在未见任务上的成功率已突破80%,“训练在仿真里,部署在真实世界中”不再是大型科技公司的专利。
- 3D感知的全面爆发:仅依赖2D图像驱动机器人操作的时代正在过去。LiDAR结合Transformer架构在语义分割、6D位姿估计和实时三维重建上取得突破。Intel RealSense、Stereolabs ZED等深度相机正成为机器人研究的标准配置。
中国研究力量的崛起是本届大会的另一大亮点。武汉大学机器人学院一举录用5篇论文,方向硬核:
- 郭迟教授团队:在视觉语言导航和多智能体协同定位上取得突破,其成果ReThinkNav已在宇树科技(Unitree)的G1机器人上完成真实物理验证。
- 李淼教授团队:聚焦VLA模型安全,开发了后门攻击擦除框架和通用对抗物体攻击方法,能使RT-2和Octo等SOTA模型的任务成功率暴跌近40%。这标志着中国学者在机器人AI安全这一关键底牌上占据了重要位置。
此外,中国动作捕捉公司NOKOV自ICRA 2024起联合发起的“New Generation Star Project”,已成为发掘青年研究者的重要渠道,体现了中国从“被选上”到“由我选”的话语权转变。
关键要点
- 数据创纪录:ICRA 2026投稿量达4947篇,录用1882篇,录用率38.04%,并额外展示约1000篇顶级期刊论文,学术含金量极高。
- 技术范式转移:机器人学正经历类似2023年NLP领域的范式转移,大语言模型用于高层规划,扩散模型用于动作生成,多模态模型用于感知融合。
- VLA成为核心:VLA相关论文占比近20%,端到端学习取代传统规划控制成为主流研究方向。
- 具身智能突破:
- Physical Intelligence的pi-0.5实现了陌生环境下的长时序灵巧操作。
- NVIDIA GR00T N1实现了跨形态机器人的零样本策略迁移。
- 技术落地加速:Sim-to-Real技术通过NVIDIA Isaac Lab等工具普及,3D感知(LiDAR+Transformer)成为标配,AI论文正快速转化为扫地机器人、机械臂等实际产品。
- 中国角色转变:中国不再仅是投稿大国,武汉大学等机构在VLA安全、多智能体协同等前沿领域取得实质性突破,NOKOV发起的青年项目提升了行业话语权。
意义与影响
ICRA作为离“机器人落地”最近的学术顶会,其风向直接预示了未来1-2年的产业趋势。
首先,AI与机器人的深度融合已成定局。生成式AI浪潮已彻底涌入机器人领域,VLA模型和端到端学习正在重塑机器人的“大脑”。这意味着未来的机器人将具备更强的泛化能力和自然交互能力,从执行预设程序转向理解复杂指令并自主规划。
其次,技术门槛降低与生态普及。Sim-to-Real工具和3D感知硬件的标准化,使得中小团队也能参与前沿研发。这将加速机器人从实验室走向工厂和家庭,推动具身智能从概念走向规模化应用。
最后,安全与伦理成为新焦点。中国学者在VLA安全领域的深入探索,如对抗攻击和后门擦除,表明行业开始正视AI模型在物理世界部署中的潜在风险。这不仅是学术竞争,更是为未来机器人产业的标准化和安全规范奠定基础。
总体而言,ICRA 2026不仅是一场学术盛宴,更是机器人产业从“技术验证”迈向“规模落地”的关键节点。中国力量的崛起,预示着全球机器人创新格局正在从“单极主导”向“多极协同”演变。
