← 返回信息流
创投信息钛媒体·5 天前

婴儿期自变量上门保姆应“0元购

原标题:婴儿期的自变量上门保姆应该“0元购”

速览

自变量机器人率先在国内推动机器人常驻家庭进行真实场景数据采集,此举旨在解决具身智能行业面临的“数据荒”问题。尽管该模式引发关于消费者付费贡献数据及采集员待遇低下的争议,但企业正通过从上门到驻家的迭代,试图大幅降低人力监督成本。这一趋势与Robotaxi行业通过去安全员和硬件降本实现商业闭环的路径相似,凸显了高质量物理世界数据对AI训练的核心价值。

AI 深度解读

背景

具身智能(Embodied AI)行业正处于数据饥渴期,训练数据的规模与质量成为决定技术突破的关键变量。随着特斯拉等头部企业推动自动驾驶向全无人化迈进,对海量真实场景数据的需求呈指数级增长。在此背景下,国内具身智能创业公司自变量机器人(Variable Robot)试图通过“机器人驻家”模式,将数据采集从实验室延伸至真实家庭环境,以解决长尾场景数据匮乏的问题。然而,这一商业尝试在降低企业数据获取成本的同时,也引发了关于消费者权益、数据伦理以及技术成熟度的舆论争议。

核心内容

自变量机器人近期宣布在国内率先推动机器人常驻家庭真实应用,由志愿者申请,公司提供搭载 WALL-B 世界统一模型的全新机器人进入家庭开展家政工作。在此之前,自变量曾与 58 同城合作推出 149 元/3 小时的智能保洁服务,采用“家政阿姨+机器人+工程师”的三方协作模式。但该服务遭遇舆论质疑,消费者反馈机器人效率低于人工且需专人监督,业内普遍认为该服务更多满足尝鲜心理,其核心价值在于为机器人训练采集数据,而非提供实际的家政价值。

数据采集是具身智能训练的核心环节,主流方法为模仿学习,即通过佩戴传感器的采集员记录动作数据。特斯拉要求采集员每天在实验室进行 8 小时重复劳动,京东也在宿迁搭建数据采集社区。自变量则面临更严峻的成本压力:机器人本体价格动辄 30 万元以上,采集员人力成本每天 200 元以上,且单人单日有效数据产出有限(约 500 条)。为了提升数据获取量,企业不断延长采集员的有效工作时长(从 4 小时增至 5-6 小时),并压低采集员时薪(低至 20 元/小时),被从业者称为“赛博流水线”。

自变量 CEO 王潜指出,具身智能的核心不在于更大的算力或 SOTA 模型,而在于从生活日常中获取数据。联合创始人兼 CTO 王昊将实验室数据称为“糖水数据”,将真实家庭中的复杂随机数据称为“牛奶数据”。从“上门保洁”到“驻家工作”,自变量的策略转变旨在大幅降低人力成本:从“一人一机”现场管理,转变为后台工程师远程监督,类似 Robotaxi 从安全员模式向云端监控模式的演进。

然而,与百度萝卜快跑(Apollo Go)相比,自变量机器人面临更复杂的挑战。萝卜快跑通过硬件成本下降(如禾赛科技传感器替代进口雷达)、安全员减配及规模效益实现了单成本低于网约车。相比之下,自变量主攻家政场景,需要更高的双臂自由度和精细操作能力,其 Quanta X2 量子 2 号机器人搭载了包括 2D 激光雷达、超声波、RGBD 相机、3D-TOF 等在内的复杂传感器体系,BOM 成本远高于主打运动场景的宇树 G1。在零部件成本未大幅下降前,自变量难以在成本战中击败人工服务,用户付费参与数据采集的合理性也面临拷问。

关键要点

  • 数据焦虑与采集模式:具身智能行业极度渴求真实场景数据以覆盖极端场景。目前主流做法是雇佣大量采集员进行标准化劳作,但面临高昂的设备与人力成本,导致企业倾向于延长采集员工作时间并压低时薪。
  • 从“上门”到“驻家”的迭代逻辑:自变量机器人从与 58 同城合作的上门保洁转向志愿者家庭驻家模式,核心目的是取代现场陪同安全员,通过后台远程监督降低人力成本,实现从“现场管理”到“长尾管理”的转变。
  • “糖水数据”与“牛奶数据”之分:自变量 CTO 王昊指出,实验室环境下的“糖水数据”稳定但缺乏真实世界认知,而真实家庭环境中的“牛奶数据”虽采集成本高,但能赋予机器人应对物理环境随机性的能力。
  • 商业模式的争议:目前的机器人家政服务效率不及人工,且需人工监督,消费者需付费体验,实质上是为企业贡献家庭场景数据。业内调侃若企业更需要数据,应向占用空间的家庭付费,而非向消费者收费。
  • 成本与技术的挑战:相比百度萝卜快跑通过硬件降本和规模效应实现盈利,自变量机器人因需适应精细家政场景,传感器配置复杂(如 Quanta X2 搭载多种雷达与相机),BOM 成本高企。在硬件成本未显著下降前,机器人难以在价格上战胜人工服务。
  • 采集员处境:数据采集员工作门槛低(大专及以上),内容单调重复(如剥水果皮、叠衣物),被戏称为“赛博流水线”,且待遇呈下降趋势,时薪低至 20 元,职业稳定性差。

意义与影响

自变量机器人的“驻家”尝试揭示了具身智能商业化初期的核心矛盾:技术迭代对海量真实数据的需求与高昂数据采集成本之间的冲突。这一模式若成功,可能为行业提供一种低成本获取长尾场景数据的路径,加速机器人从实验室走向家庭。

然而,该模式也引发了深刻的伦理与商业反思。首先,它模糊了“消费者”与“数据劳工”的界限,用户付费参与服务实则是在为企业提供免费或低成本的数据标注与场景反馈,这种价值交换的不平衡可能阻碍技术的广泛普及。其次,它重现了自动驾驶早期“安全员”模式的困境,即通过压低人力成本来掩盖技术成熟度的不足。

最终,具身智能能否真正进入家庭,不取决于数据采集模式的创新,而取决于硬件成本(如传感器、电机)的实质性下降以及算法对复杂环境理解能力的突破。只有当机器人的综合成本低于人工服务,且具备真正的实用价值时,行业才能摆脱“数据饥渴”带来的焦虑,实现可持续的商业闭环。

查看原文 →tmtpost.com