这家初创公司押注印度零工经济能训练全球机器人
速览
由加州大学伯克利分校和斯坦福大学研究人员创办的初创公司Human Archive,正在印度雇佣零工经济从业者。这些工人佩戴配备摄像头的帽子和传感器设备,用于收集现实世界的物理训练数据。此举旨在为AI和机器人实验室提供急需的高质量数据,以加速机器人的研发与训练进程。
AI 深度解读
Human Archive:押注印度零工经济,为全球机器人训练提供“第一视角”数据
背景
近年来,印度的在线食品配送市场经历了显著增长,Zomato 和 Swiggy 等巨头相继上市,云端厨房(cloud kitchens)数量激增。与此同时,专注于家庭服务的初创企业,如按需家庭用工平台 Urban Company、Snabbit 和 Pronto,也迅速崛起并受到市场欢迎。
在这一背景下,总部位于硅谷的初创公司 Human Archive 试图利用这一趋势。该公司与上述行业内的企业合作,让工人佩戴带有摄像头的特殊帽子,收集日常任务的“自我中心”(egocentric,即第一人称视角)视频数据。这些数据旨在用于训练能够执行物理任务的机器人。
尽管 Human Archive 未公开具体合作伙伴名单,但表示正在与家庭服务、酒店和餐饮行业的公司合作,目前已在多个地点部署了超过 1,000 个活跃的头戴式设备。
核心内容
Human Archive 的成立直接押注了 AI 行业的发展方向。随着机器人实验室和前沿 AI 公司竞相制造能在现实世界中执行物理任务的机器,它们面临着一个关键瓶颈:缺乏高质量、反映现实世界人类日常工作的训练数据。Human Archive 的核心逻辑是:印度蓬勃发展的零工经济中的工人,正是这种未被充分挖掘且可扩展的数据来源。
融资与团队 凭借上述业务进展,Human Archive 于周二宣布完成 820 万美元融资。投资方包括 Wing Venture Capital、NVP Capital、Y Combinator,以及来自 OpenAI、Nvidia、Google、Mercor、AfterQuery、BAIR、SAIL、Brad Boa 和 Meta 的天使投资人。
该公司由三名加州大学伯克利分校学生和一名斯坦福大学学生创立,分别是 Samay Maini、Rushil Agarwal、Shloke Patel 和 Raj Patel(后两人为表兄弟,Raj Patel 担任 CEO)。四位创始人均拥有涵盖机器人技术、硬件和触觉数据的科研背景。
与行业巨头的博弈 虽然 Human Archive 正在与多家合作伙伴开展工作,但该公司表示曾遭到许多印度家庭服务公司的拒绝,包括 Pronto 和 Urban Company。
这一拒绝事件在上周末成为公众焦点。印度媒体 Entrackr 报道,Pronto 正在积极寻求合作伙伴以收集工人数据用于机器人训练,而 Snabbit 曾与 Human Archive 进行过早期讨论,但项目最终搁浅。
Urban Company CEO Abhiraj Singh Bhal 在 X(原推特)上回应称,该公司不会参与此类安排。对此,Raj Patel 反击称,Urban Company 若不重新考虑,将面临客户流失并失去相关性。联合创始人 Rushil Agarwal 则更为直白地表示,Pronto 创始人 Anjali Sardana 在听到数据合作提议时嘲笑他,并称他为“愚蠢的人”(stupid)。Pronto 承认了对话的存在,但表示选择不推进该项目,并否认了 Agarwal 被称作“愚蠢”的说法。
技术差异化:多模态数据同步 尽管面临拒绝,Human Archive 并未止步。为了区别于其他仅收集视频数据的初创公司,Human Archive 正在使用并开发额外的硬件设备,包括触觉手套、全身动作捕捉服和腕部摄像头。这些设备能够同步捕捉运动、触觉力以及 RGB-D(实时配对的颜色图像与深度信息)数据,并出售给 AI 实验室。
公司认为,仅靠视频数据是不够的,将其与其他传感器数据配对能显著提升数据价值。
最初,Human Archive 使用自制装置或现成设备采集数据。现在,他们正在开发协同工作的定制硬件,目前已部署超过 50 种不同的设备以收集不同的数据点。
Raj Patel 表示:“为了采集数据,我们最初使用 iPhone;然后我们构建了自定义的支架和帽子。现在我们有超过七种不同的硬件产品,可以在不同模态间互换使用。在从不同设备采集数据后,我们致力于同步来自所有这些不同源的数据。”
数据验证与商业模型 Human Archive 正在开发利用自有数据微调 AI 模型的方法,并在机器人上进行测试以评估任务有效性。通过这种方式,该公司可以向潜在客户展示数据质量,并在内部对模型进行后训练。
Wing VC 合伙人 Zach DeWitt 指出,Human Archive 在从多传感器收集数据方面具有独特优势:“世界上没有任何其他公司能够大规模同步和收集头戴式 RGB-D、力反馈、全身动作捕捉以及同步的胸部和腕部摄像头数据。他们一直在利用这些数据进行内部模型训练,由于传感器的新颖性和即将发布的新数据集规模,每个主要实验室和大学都有兴趣在其上进行实验。”
印度市场的运营策略与争议 尽管遭到知名家庭服务公司的拒绝,Human Archive 仍与较小的初创企业合作,向消费者提供折扣服务。当工人到达客户家中时,消费者可以通过应用选择:同意数据收集以支付折扣价,或支付全价以获得无记录的服务。
Patel 提到,客户对选择前者感到满意,因为服务质量纠纷很常见,而视频记录有助于解决这些纠纷。
在薪酬方面,Human Archive 向参与自我中心数据采集的工人支付每小时 1 美元的基础费率。《经济时报》的一份报告显示,其他公司支付每小时 250 至 400 卢比(约合 2.63 至 4.20 美元)。Patel 承认竞争对手支付更高,但其在地面的存在使其能够保持较低的薪酬水平。
DeWitt 表示:“Human Archive 的网络在全球范围内提供了即时、灵活的赚钱机会,降低了参与 AI 经济的门槛。我们将其视为连接即时生计与构建更安全、更高效未来基础设施的关键桥梁。”
隐私与监管风险 通过视频记录收集数据引发了隐私担忧。目前尚不清楚 Human Archive 向工人提供了多少关于其镜头用途的信息。该公司表示,其商业合同符合印度的《数字个人数据保护法》(DPDP Act),因为其在应用中展示了隐私政策通知,以及详细说明数据收集目的和处理方式的同意信息。公司声称所有数据均已匿名化,并对录像中的人脸进行了模糊处理。
然而,上周 Moneycontrol 报道,印度电子信息技术部正在调查通过家庭服务工人收集自我中心数据的初创公司的同意机制和数据收集做法。
扩张计划 虽然 Human Archive 主要在印度收集数据,但已开始向东南亚和美国扩张。该公司还在构建一个平台,让任何人都可以参与数据收集并赚钱。它还希望向美国客户提供清洁或烹饪等服务,以换取参与工人的数据收集——尽管这些项目仅处于早期试点阶段。
关键要点
- 核心商业模式:Human Archive 通过让印度零工经济中的工人佩戴多传感器设备(头盔、触觉手套、腕部摄像头等),收集第一人称视角(egocentric)的多模态数据,用于训练物理 AI 和机器人。
- 融资情况:近期完成 820 万美元融资,投资方包括 Wing VC、NVP Capital、Y Combinator 以及来自 OpenAI、Nvidia、Google、Meta 等科技巨头的天使投资人。
- 技术壁垒:区别于单一视频数据收集,Human Archive 强调多传感器数据的同步采集(RGB-D、力反馈、动作捕捉),并拥有超过 50 种部署设备和 7 种可互换的硬件产品。
- 市场阻力:遭到印度头部家庭服务公司 Pronto 和 Urban Company 的拒绝,双方曾在社交媒体上发生公开争执,Pronto 甚至被指创始人言语侮辱对方联合创始人。
- 数据变现与激励:通过向消费者提供折扣服务换取数据收集同意;向工人支付约 1 美元/小时的基础费率(低于部分竞争对手,但依托本地化运营降低成本)。
- 隐私合规挑战:虽然声称符合印度 DPDP 法案并匿名化处理数据,但印度政府相关部门已介入调查此类初创公司的数据收集实践和同意机制。
- 全球扩张:业务正从印度扩展至东南亚和美国,并计划建立通用平台让公众参与数据赚取。
意义与影响
Human Archive 的案例揭示了当前物理 AI(Physical AI)发展中的一个核心矛盾与机遇:高质量现实世界数据的稀缺性。
- 数据成为新石油:随着 AI 从数字世界走向物理世界,机器人需要“看”和“感”知现实。Human Archive 证明了将人类日常劳动转化为训练数据具有巨大的商业价值。这种“数据即服务”的模式可能成为未来 AI 基础设施的重要组成部分。
- 零工经济与 AI 的融合:该公司
