← 返回信息流
AI 资讯雷峰网·1 天前

桥介数物尚阳星:机器人全身运动能力远未解决

原标题:对话桥介数物尚阳星:机器人运动能力,远远没有被解决

速览

桥介数物创始人尚阳星指出,机器人全身运动能力的重要性被严重低估,当前行业过度聚焦上半身操作而忽视底层运动基础。为此,桥介数物正式投入使用“跨本体全身运动数据工厂”,采集高质量CWM数据以训练通用全身运动模型。该举措旨在解决机器人运动泛化难题,推动其从具身小脑厂商向基础设施公司转型。

AI 深度解读

背景

在具身智能(Embodied AI)领域,随着人形机器人Demo在跑跳、越障等场景的表现日益成熟,行业焦点长期集中在“操作”能力上,即机器人末端的精细操作数据。然而,桥介数物(Bridge Intelligence)创始人尚阳星提出了截然不同的观点:机器人进入真实世界完成复杂任务,仅靠操作能力远远不够,底层的全身运动能力才是基础。

尚阳星将机器人的运动控制能力比作操作系统的内核,而操作模型则是应用软件。缺乏底层系统,应用无法运行。基于这一判断,桥介数物在半年前启动了“跨本体全身运动数据工厂”的建设,并于近期正式投入使用。该公司由最初的具身小脑厂商,转型为具身智能基础设施公司,旨在构建类似 Runtime Robot OS 的通用底层运动能力基础设施。

核心内容

桥介数物的核心战略围绕“跨本体全身运动数据”(Cross-Embodiment Whole-Body Motion Data, 简称 CWM)展开。CWM 是一种多模态数据,包含人体全身动作、第一人称和第三人称视角视频、语义标签、环境信息以及接触与物理状态信息。其最大亮点在于具备跨本体能力,即训练出的通用全身运动模型可以被不同构型的机器人复用,新机型接入时无需为大量动作重复训练。

1. 行业痛点与现状 目前机器人运动视频多针对特定场景调试,泛化能力差。例如,春晚机器人的表演需工程师数月定制,换场景即失效。此外,真实环境中机器人面临感知被动(如闭眼走路般的反应滞后)、长期运行后的自我补偿能力不足等问题。行业虽聚焦上半身操作,但忽略了全身协同作业的基础,导致复杂操作只能局限在固定桌面,难以真正落地。

2. 自建数据工厂的必要性 桥介数物选择自建数据工厂而非购买数据,主要基于三个原因:

  • 高质量数据稀缺:市面上缺乏高质量运动控制数据,且价格昂贵。
  • 解决“本体绑定”问题:过去数据与特定机型强绑定,迁移能力差。桥介采集无本体的人体数据,促进模型快速迭代。
  • Scaling Law(缩放定律):数据规模越大,全身运动基础模型表现越好。英伟达等项目也印证了这一观点,但当前数据量级离上限尚远。

3. 数据采集与技术壁垒

  • 采集方式:采用“动捕 + 视频”方式,采集人类全身动作,并人为标注语义标签。相比 UMI 等仅保留末端执行器的方案,全人动捕精度更高,且数据更通用,不绑定特定机器人。
  • 跨本体重定向引擎:这是桥介的技术壁垒。行业多数方案仅考虑运动学(复现轨迹),桥介加入了动力学考量(重力、受力、平衡)。例如,人跳起是抛物线,机器人若仅模仿轨迹易失败,加入动力学后能结合自身体结构调整动作,符合物理规律。
  • 适用形态:主要面向双足人形机器人,因为其与人类形态最接近,数据迁移最容易。尚阳星认为,尽管四足或轮足落地看似更快,但双足人形才是实现物理世界 AGI 的通用形态。

4. 数据闭环与质量控制

  • 分层架构:上层负责认知和任务理解(推理慢),底层负责实时运动控制(高实时性、高安全性)。桥介专注于底层运动控制模型。
  • 高质量标准:数据需噪声小、轨迹稳定、姿态自然。通过高精度动捕设备源头采集,结合人工核验、程序自动筛选及自研管线清洗。
  • 脏数据定义:区分“任务失败数据”(如摔倒后起身,有价值)和“低质量数据”(设备故障导致的错误动作,无价值)。
  • 规模与质量平衡:先用小规模高质量数据训练模型,再用模型从视频中挖掘大规模数据,相互增强。仿真数据量级远超真实数据,用于弥补人体动作与机器人实际执行间的差距。

5. 商业化与未来规划

  • 产能:已跑通端到端链路,累计产出近千小时高质量 CWM 数据。计划年内采集上万小时数据。
  • 产品:6月将推出标准化运动控制平台产品,实现跨本体和跨机型泛化。
  • 投入:动捕设备、场地及运营整体投入在千万级别。一小时数据采集成本约几百元,合格率90%以上。
  • 长期目标:构建人形机器人的通用操作系统和应用生态。尚阳星认为,底层平台能力比硬件更具长期投资价值。

关键要点

  • 核心观点反转:机器人落地瓶颈不在操作,而在底层全身运动能力。运动控制是操作系统内核,操作是APP。
  • 数据定义:CWM(跨本体全身运动数据)是多模态数据,核心优势是跨本体迁移能力,解决数据与机型绑定的问题。
  • 技术壁垒:自研重定向引擎,不仅考虑运动学,还加入动力学(重力、受力、平衡),提高动作符合物理规律的程度。
  • 采集策略:采用高精度全身动捕 + 视频,而非仅末端遥操作(如 UMI),以确保数据精度和通用性。
  • Scaling Law 应用:坚信数据规模对模型效果有决定性影响,目标积累几十万小时运动数据。
  • 架构分层:认知模型与运动控制模型分离,桥介专注高实时性、高安全性的底层运动控制。
  • 仿真与真实结合:仿真数据量级远超真实数据,用于强化学习训练和泛化。
  • 商业定位:从具身小脑厂商转型为基础设施公司,提供标准化运动控制平台,构建应用生态。

意义与影响

桥介数物的实践揭示了具身智能落地的深层逻辑:数据基础设施的重要性被严重低估

  1. 推动行业从“Demo”走向“通用”:当前机器人运动多为特定场景定制,桥介通过构建通用全身运动模型,旨在解决泛化能力差的问题,使机器人能适应不同地形、机型和环境扰动,这是实现真正自主作业的关键一步。
  2. 确立“无本体”数据趋势:通过强调跨本体能力和无本体数据采集,桥介推动了行业摆脱对特定硬件的依赖,促进了数据复用和模型迭代效率,类似于计算机领域操作系统与应用软件的分离。
  3. 重新定义竞争壁垒:在硬件同质化严重的背景下,桥介通过自建数据工厂和自研重定向引擎,构建了基于数据规模、质量及处理算法的软性壁垒。这印证了投资人观点:底层平台能力比硬件更具长期价值。
  4. 加速 AGI 落地路径:尚阳星提出的“双足人形先于四足落地”的非共识观点,基于数据积累速度的类比(如大语言模型依赖海量文本)。若此路径成立,将加速通用机器人时代的到来,并催生基于标准化运动能力的创新应用生态。
查看原文 →leiphone.com