UC Berkeley Ken Goldberg 教授:具身数据规模落后十万年,你仍然相信数据万能吗?| ICRA 2026
AI 深度解读
背景
在 ChatGPT 引发的大模型浪潮下,视觉语言动作模型(VLA)与人形机器人热潮兴起。行业普遍弥漫着一种乐观情绪:正如大数据解决了视觉和语言问题,依靠海量数据、深度学习和大模型驱动的 Model-Free(无模型)路线,必将通过 Scaling Law 将具身智能推向 GPT 时刻。
然而,在 ICRA 2026 会议上,UC Berkeley 教授 Ken Goldberg 发出了不同的声音。他提出了著名的“十万年数据鸿沟”概念,对“数据万能论”提出了尖锐质疑,并探讨了具身智能落地的现实路径。
核心内容
1. 十万年的数据鸿沟
Ken Goldberg 指出,当前具身智能面临的最大瓶颈是数据的极度匮乏。如果按照人类平均阅读速度计算,阅读完今天训练大型语言模型(LLM)所使用的全部数据,大约需要 10 万年;而换算到机器人领域,目前积累的数据总量仅相当于几年的规模。
此外,机器人系统的状态空间维度极高(如人形机器人仅双手和手臂就超过 50 维),且缺乏互联网级别的大规模训练数据。因此,尽管大数据终将解决机器人问题,但核心问题在于“什么时候发生”。
2. 两种文化的冲突:Model-Based vs Model-Free
Goldberg 将机器人学
查看原文 →leiphone.com
