← 返回信息流
AI 资讯The Verge AI·6 天前3 源报道

这家 AI 初创公司免费为你打扫房屋,以训练未来机器人

原标题:This AI startup will clean your home for free to train future robots

速览

AI 训练初创公司 Shift 推出了一项独特服务:免费为用户打扫房屋,条件是记录清洁过程。这些视频数据将被用于训练机器人,其价值足以覆盖服务成本。此举旨在通过真实场景数据加速机器人技术的发展。

AI 深度解读

Shift 免费清洁服务背后:用你的家训练未来的机器人

背景

在生成式 AI 和具身智能(Embodied AI)迅速发展的当下,数据已成为训练先进模型的核心燃料。然而,对于旨在开发能够执行物理世界任务的机器人公司而言,互联网上现有的视频数据往往缺乏真实世界的复杂性和多样性。

总部位于美国的 AI 训练初创公司 Shift 近日推出了一项极具争议但也充满创新意味的服务:免费为用户清洁家居。这项服务并非单纯的慈善或营销噱头,其核心逻辑在于通过记录清洁过程,收集高质量的“人类劳动数据”,用于训练未来的家用机器人。这一举措揭示了 AI 行业从纯数字内容向物理世界交互延伸时,对真实场景数据日益迫切的需求。

核心内容

Shift 在社交媒体上宣布了一项 unusual(不寻常)的服务:用户可以获得免费的家居清洁服务,但代价是允许公司记录清洁过程。正如其官网所言:“你得到一尘不染的公寓,我们得到训练数据。双赢。”

记录设备:“魔法帽”

在宣传视频中,身穿整洁白色制服的清洁人员佩戴着一顶外观奇特的帽子,被称为“魔法帽”(magic hat)。这顶帽子并非时尚单品,而是一个集成了摄像头的设备,能够从清洁人员的**第一人称视角(POV)**录制视频。视频中展示了清洁人员利用该设备擦窗户、拖地、吸尘、洗碗和擦拭台面等动作。

数据收集与隐私保护

Shift 强调,用户支付的“费用”即为允许拍摄的数据价值。针对用户最关心的隐私问题,Shift 在其官网声明中称,客户的隐私受到“完全保护”。在数据用于 AI 训练之前,敏感细节如姓名、面部特征以及屏幕或身份证上的个人信息都会被模糊化和匿名化处理。

此外,Shift 指出,其清洁人员并非公司员工,而是由合作伙伴进行背景审查和筛选的第三方人员。

数据价值与局限性

Shift 联合创始人兼联席 CEO Bercan Kilic 表示,清洁产生的训练数据价值足以覆盖服务成本。公司 FAQ 页面指出,“更具挑战性的清洁环境”对训练尤其有用,这意味着杂乱或复杂的家居环境反而更具数据价值。

当然,服务并非毫无限制。清洁人员有权拒绝任何让他们感到不适的具体任务。

市场扩张与未来愿景

目前,该免费服务仅在纽约提供,但 Kilic 表示,很快将在旧金山、伦敦、苏黎世和慕尼黑推出。虽然免费清洁是限时活动,但其商业模式契合了日益增长的人类任务录制市场。据悉,Shift 已经通过其应用程序向全球 15 个国家的数万人付费,以记录他们的日常活动。

Shift 的愿景不止于清洁。其宣传视频暗示,未来计划将数据采集扩展到管道维修、烹饪和建筑等其他领域,旨在为“今天清洁房屋,明天实现房屋自清洁”奠定基础。

关键要点

  • 商业模式创新Shift 采用“数据换服务”的模式,通过提供免费清洁服务换取第一人称视角的家居清洁视频数据,用于训练机器人 AI。
  • 技术载体:使用佩戴在清洁人员头上的集成摄像头(“魔法帽”)进行录制,获取极具沉浸感和实用价值的 POV 数据。
  • 隐私合规措施:承诺在数据用于训练前对面部、姓名及屏幕信息等敏感数据进行模糊和匿名化处理;清洁人员为第三方合作伙伴,非直接雇员。
  • 数据偏好:公司明确表示,环境越复杂、清洁难度越大,数据对训练越有价值。
  • 全球扩张计划:从纽约起步,即将扩展至旧金山、伦敦、苏黎世和慕尼黑;目前已在全球 15 个国家通过 App 付费收集各类人类活动数据。
  • 长期战略:清洁仅是起点,未来计划将数据采集领域扩展至管道、烹饪、建筑等更广泛的物理世界任务,旨在训练能够自主执行家务的通用机器人。

意义与影响

1. 具身智能的数据瓶颈突破 当前,大语言模型(LLM)和视觉语言模型(VLM)的发展已相对成熟,但让机器人理解并执行物理世界任务(即具身智能)仍面临巨大挑战。Shift 的做法直击痛点:通过收集真实、动态、第一人称视角的人类操作数据,为机器人提供模仿学习(Imitation Learning)所需的宝贵素材。这种“人类示范”数据比合成数据或静态数据集更能反映现实世界的复杂物理交互。

2. “数据飞轮”的新形态 传统 AI 公司通常通过付费众包平台(如 Scale AI)收集数据,而 Shift 探索了一种更贴近最终应用场景的数据获取方式。将数据收集嵌入到实际服务中,不仅降低了用户参与门槛(免费服务),还确保了数据的真实性和高频更新。这种模式可能成为未来机器人公司获取垂直领域数据的新范式。

3. 隐私与伦理的新挑战 尽管 Shift 承诺了隐私保护,但在家中进行无死角的第一人称录制仍引发了关于家庭隐私边界的讨论。如何确保匿名化处理在复杂家庭环境中(如背景中偶然出现的私人信件、屏幕内容)的有效性,将是监管机构和技术团队需要持续面对的问题。此外,清洁人员作为“数据收集者”的身份界定及其权益保障,也是该商业模式中不可忽视的社会伦理议题。

4. 机器人普及的前奏 Shift 提出的“今天清洁,明天自清洁”愿景,描绘了家庭自动化的终极形态。随着此类数据积累的增加,家用机器人的智能化水平有望加速提升,从而推动机器人从工业场景走向家庭场景,引发劳动力市场和社会结构的深远变革。

查看原文 →theverge.com