← 返回信息流
AI 资讯量子位·2 小时前

星海图创始人高继扬:具身智能三层技术路线无捷径

原标题:星海图创始人高继扬:具身智能三层技术路线,没有捷径可走

速览

星海图创始人高继扬在WDC大会上抛出三个关键信号,重点阐述了具身智能的三层技术路线。他指出,尽管数据投入巨大,但这是构建具身智能不可或缺的基石,行业不存在速成的捷径。这一观点为具身智能的发展路径提供了清晰的指引。

AI 深度解读

背景

2026年6月16日,具身智能公司星海图(Galaxea)举办第一届全球开发者大会(Galaxea WDC 2026)。此次大会不仅是技术发布的窗口,更是行业生态的一次集中展示。活动现场汇聚了上百位全球开发者、顶尖学者及产业链上下游伙伴,甚至包括海外机器人企业。

从嘉宾阵容来看,清华大学电子工程系教授汪玉、今日资本创始人徐新等重量级人物出席,传递出“学术+资本+产业链”高密度融合的强烈信号。星海图创始人兼CEO高继扬认为,2026年似乎是具身智能发展的分水岭。在新一代具身基础模型G0.5和首款双足人形机器人Kengo亮相不到半个月后,星海图通过此次大会,重点阐述了其在数据、模型及生态三个维度的战略意图。

核心内容

数据:真机数据的核心地位与成本结构

星海图将数据视为具身智能的底层生产资料,而非辅助要素。为此,公司联合北京亦庄发起成立新数据公司「亦数智能」(亦数智能(北京)科技有限公司),星海图持股25%。该计划旨在收集100万小时超高质量真实数据,首批共建企业包括原力灵机、蚂蚁数科、百度智能云、猎聘、海天瑞声等15家公司。

高继扬指出,具身智能的数据采集不同于大模型的被动收割,更像丰田式的精细经营,需对每条数据进行控制与验证。目前行业普遍采用UMI(Unsupervised Multimodal Imitation)和Egocentric(第一人称视角)数据作为廉价替代方案,但星海图认为这并非终局,更倾向于长期积累真机数据,并逐步引入互联网身体数据、人类行为数据及物品交互数据。对于仿真数据(合成数据),星海图持保守态度,认为其与真机数据差异较大,难以总结有效算法,且海外案例(如Genesis AI)也证明合成数据在预训练中存在局限。

在成本方面,高继扬提出“智能总成本”概念,包含数据、算力及研发团队成本。实践中,数据与算力成本比例约为1:10。真实世界数据分为两类:

  • Human centric data(人类行为数据):成本约50~100元人民币/小时。
  • Robot centric data(机器人遥操作数据):涉及遥操作、人工控制及设备折旧,成本约250元人民币/小时(市场报价可达300~350元/小时)。

若实现100万小时数据采集,总成本约为1亿~2亿元人民币。高继扬认为,相较于每年数亿美金级别的算力支出,这一数据投入是必要且划算的,因为若数据不Work,后续模型训练将毫无意义。

模型:G0.5开源与三层技术路线

大会发布了新一代VLA(Vision-Language-Action)基础模型G0.5,并宣布开源。星海图联合创始人、CTO赵行介绍了公司的三层技术路线:

  1. 本能智能:让机器人协调全身。
  2. 作业智能:让机器人干活。
  3. 进化智能:让AI重新定义机器人形态。

G0.5处于第二层“作业智能”,其核心突破在于将VLA统一进一个自回归生成框架。视觉、语言、思维链与动作不再分段处理,而是在同一数据流中连续生成,实现“边理解边执行”的闭环推理。

关于G0.5在双足人形机器人Kengo上的应用,赵行表示至少需等到今年年底。主要瓶颈在于端侧算力不足,特别是NVIDIA Jetson Thor虽被定义为“机器人大脑”,但其高功耗和大体积限制了其在小型人形机器人中的应用。因此,G0.5目前更适配双臂智能或轮式双臂平台(如R1 Lite、R1 Pro、单臂A1Z)。

在“本能智能”阶段,强化学习为主,模仿学习为辅;而在“作业智能”阶段,模仿学习为主,强化学习为辅。高继扬预测,两条路径最终将走向融合。

此外,星海图发布了第一版世界模型Fast-WAM。针对市面上多数世界模型在视频生成模型上叠加策略模块导致推理链路冗长的问题,Fast-WAM进行了结构性简化:去掉推理阶段的视频预测过程,仅保留训练阶段学到的世界表征能力。结果显示,模型性能无明显下降,但推理速度提升4倍以上,且可在消费级显卡上稳定运行5亿~10亿参数规模的模型。

生态:从整机销售到物理世界Token销售

星海图正从单一技术提供商转向生态构建者。除了数据公司,大会还联合凯辉基金发布创业孵化项目「星途计划」,重点关注数据驱动智能、应用场景突破及下一代核心技术。过去一年,星海图已投资近10家企业,未来3~5年计划投资30~50家,旨在构建产业拼图。

高继扬强调,具身智能链条极长,涉及AI、机器人、本体、传感器、制造等多个环节,没有任何一家公司能独自定义行业。星海图选择“生态平权”路线,通过开放技术、工具和接口,降低入行门槛。

商业模式上,高继扬提出了三段式演进路径:

  1. 整机销售:承担场景验证功能。例如,2024年10月,首批GalaxeaR1机器人本体交付给斯坦福李飞飞实验室。
  2. 方案订阅:当系统能力可被持续调用、任务能力实现模块化订阅时。
  3. 物理世界Token销售:智能驱动的商业化最终形态。

关键要点

  • 数据战略激进:星海图联合多方成立「亦数智能」,目标采集100万小时真机数据,预计投入1亿~2亿元人民币,强调真机数据优于仿真/合成数据。
  • 成本结构清晰:数据与算力成本比约为1:10,Human centric data约50-100元/小时,Robot centric data约250元/小时。
  • 模型架构创新:G0.5模型将VLA统一至自回归生成框架,实现“边理解边执行”;Fast-WAM世界模型通过简化推理链路,使推理速度提升4倍以上,并支持消费级显卡部署。
  • 硬件落地限制:受限于NVIDIA Jetson Thor等端侧算力的功耗与体积,G0.5模型短期内难以完全适配双足人形机器人Kengo,主要落地于轮式或双臂平台。
  • 技术路线融合:遵循“本能智能(强化学习为主)→ 作业智能(模仿学习为主)→ 进化智能”的三层路线,最终两条路径将融合。
  • 生态化布局:通过「星途计划」投资30~50家企业,推行“生态平权”,开放技术与接口,降低行业门槛。
  • 商业模式演进:从整机销售(如交付斯坦福李飞飞实验室)向方案订阅,最终走向“物理世界Token销售”。

意义与影响

星海图的此次发布标志着具身智能行业从单纯的技术验证进入生态构建与规模化数据积累的关键阶段。

首先,数据成为核心竞争壁垒。星海图敢于投入巨资构建真机数据闭环,并明确区分数据与算力的成本关系,为行业提供了数据工程化的参考范式。其对仿真数据的谨慎态度,也提醒业界需正视真实世界数据的稀缺性与高价值。

其次,技术路线趋于务实。G0.5的开源与Fast-WAM的优化,展示了在算力受限条件下如何通过算法创新(如简化推理链路、统一生成框架)提升效率。同时,承认端侧算力对双足机器人的制约,反映了行业从“炫技”向“工程落地”的理性回归。

最后,生态协同成为必然选择。星海图通过投资与孵化构建“生态平权”,表明具身智能无法由单点突破完成,必须依靠产业链上下游的紧密协作。这种从整机销售向“物理世界Token”销售的商业模式构想,预示着未来具身智能可能像互联网一样,以服务和能力调用的形式渗透进物理世界。

查看原文 →qbitai.com