← 返回信息流
AI 资讯TechCrunch AI·2 小时前2 源报道

General Intuition融资3.2亿美元押注游戏训练AI直觉

原标题:General Intuition raises $2.3B on bet that video games can train AI agents for the real world

速览

General Intuition宣布完成3.2亿美元融资,旨在扩大基于数百万小时游戏画面训练的AI规模。该公司押注动作数据能帮助AI发展出更接近人类直觉的能力。这一进展标志着利用游戏环境模拟现实世界智能的新尝试。

AI 深度解读

General Intuition 融资 3.2 亿美元:以电子游戏为跳板,训练具备“直觉”的通用 AI 智能体

背景

在人工智能领域,如何训练出能够理解物理世界、具备因果推理能力的通用智能体(AI Agents),一直是行业面临的巨大挑战。大多数现有方法依赖大量昂贵且缓慢收集的现实世界数据,或者仅通过视频推断动作,缺乏对“自我”与“环境”交互的深刻理解。

在此背景下,General Intuition 应运而生。该公司由 31 岁的 Pim de Witte 联合创立,其前身是游戏视频分享平台 Medal。Medal 积累了数亿小时的游戏游玩数据,这为 General Intuition 提供了独特的训练素材。2024 年 10 月,该公司以 1.34 亿美元的首轮融资启动。近日,General Intuition 宣布完成新一轮融资,旨在利用游戏数据中的“动作标签”来训练具备空间时间推理能力和类人直觉的 AI 模型,并将其应用于机器人控制和模拟环境。

核心内容

General Intuition 的核心愿景是打造一个能够从游戏游玩数据泛化到模拟环境,最终应用于实体机器人的通用智能体模型。这一理念通过其纽约办公室的研发场景得到了直观体现:一个由 AI 驱动的机器狗在办公室内自由行走,其背后的“大脑”与正在玩《Fortnite》(堡垒之夜)的 AI 智能体是同一个模型。

数据优势与训练逻辑 General Intuition 并非从零开始收集数据,而是利用了其前身 Medal 平台积累的数亿小时游戏视频。然而,创始人 Pim de Witte 指出,关键 ingredient(关键要素)并非视频画面本身,而是嵌入在视频中的“动作标签”(Action Labels),即玩家按下哪些按钮以及何时按下。

De Witte 认为,大多数竞争对手试图仅从视频中推断动作,这是不充分的。General Intuition 的方法是将此视为“未来预训练”的下一个阶段。通过结合屏幕上的游戏信息与真实世界的动态,模型能够以一种大型语言模型(LLM)无法做到的方式做出反应。这种基于动作数据的学习,帮助模型区分“自我”与“环境”,从而建立起更丰富的因果理解。

技术演示与“世界模型” 在演示中,General Intuition 展示了一个名为“世界模型”(World Model)的系统。与传统游戏引擎不同,该环境是逐帧生成的。测试者发现,AI 智能体能够准确识别墙壁、梯子和光影变化,不会像其他一些演示中的智能体那样穿墙而过。

值得注意的是,这个“世界模型”并非最终产品,而是内部称为“健身房”(the gym)的训练环境。公司最终目标是销售具备行动能力的智能体模型。数据显示,仅需 8 分钟的真实世界机器人数据,即可对该模型进行微调,使其适应四足机器人。有趣的是,这些微调数据是在街道上收集的,而非在办公室环境中,证明了模型强大的泛化能力。

融资情况与资金用途 General Intuition 近日宣布以 23 亿美元的估值融资 3.2 亿美元,使其总披露融资额达到 4.54 亿美元。本轮融资由 Khosla Ventures 领投,General Catalyst、Jeff Bezos(杰夫·贝佐斯)、Eric Schmidt(埃里克·施密特)、Nico Rosberg(尼科·罗斯伯格)以及 Google DeepMind 和 MIT 的研究人员参投。

筹集的资金将主要用于扩大计算能力。公司已与 CoreWeave 达成协议,重点预训练下一代模型。此外,部分资金将用于在夏季结束前更广泛地开放其 API。

伦理立场与公司愿景 General Intuition 的投资者,尤其是领投方 Khosla Ventures 的 Vinod Khosla,认为这是一家“世代级”的公司,而非潜在的并购目标。Khosla 指出,LLM 的量子飞跃在于“推理”的出现,而世界模型的量子飞跃在于 AI “直觉”的涌现,游戏中的动作和反应数据正是这种直觉涌现的关键。

创始人 Pim de Witte 具有人道主义工作背景(曾与无国界医生合作),因此为技术设定了明确的伦理红线:绝不开发用于伤害人类的智能体,拒绝参与“致命自主性”(lethal autonomy)的研发。他批评硅谷日益增长的军事化倾向,并强调团队中许多成员来自欧洲,持有不同的价值观。

为了应对 AI 可能带来的就业冲击,General Intuition 最近推出了名为 Nerve 的平台,这是一个面向游戏玩家的就业市场。玩家可以利用现有设备参与数据标注,并逐步过渡到机器人远程操作等任务。De Witte 认为,Medal 的用户群体正是最容易受到 AI 驱动替代影响的一代,他希望他们能从中获益。

关键要点

  • 巨额融资与高估值:General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,总融资额达 4.54 亿美元。投资方包括 Khosla Ventures、Jeff Bezos、Eric Schmidt 及多家顶级学术机构。
  • 独特数据壁垒:核心优势在于 Medal 平台积累的数亿小时游戏数据,特别是其中包含的精确“动作标签”(玩家按键记录),这比单纯的视频数据更能帮助 AI 理解因果关系。
  • 技术路径创新
    • 不依赖昂贵的现实世界大规模数据采集,而是通过游戏数据作为可扩展的捷径。
    • 构建“世界模型”作为训练环境(Gym),让 AI 学习空间、时间及物理规律(如墙壁不可穿越)。
    • 仅需少量(如 8 分钟)真实世界数据即可对模型进行微调,实现从虚拟到现实的泛化。
  • 产品定位:公司不直接开发最终应用(如自动驾驶汽车),而是作为底层模型提供商(类似 Anthropic 或 OpenAI),出售具备行动能力的智能体模型,并计划开放 API。
  • 明确的伦理边界:创始人 Pim de Witte 坚持非军事化立场,拒绝开发用于伤害人类的智能体,这与当前硅谷部分企业的军事化趋势形成鲜明对比。
  • 社会责任感:推出 Nerve 平台,利用现有游戏玩家群体参与 AI 数据标注和机器人操作,试图缓解 AI 带来的就业替代焦虑,让受影响群体分享技术红利。
  • 行业共识:投资者认为,世界模型的下一个“量子飞跃”是 AI “直觉”的涌现,而游戏中的交互数据是培养这种直觉的关键。

意义与影响

General Intuition 的崛起标志着 AI 训练范式的一个潜在转折点。长期以来,具身智能(Embodied AI)的发展受限于现实世界数据获取的高成本和低效率。General Intuition 提出的“游戏即捷径”假设,如果能在大规模物理世界中得到验证,将极大地降低训练通用智能体的门槛。

首先,数据效率的革命。通过利用游戏中蕴含的丰富因果逻辑和动作反馈,General Intuition 试图证明虚拟环境可以成为现实世界机器人训练的高效模拟器。这种从“视频理解”到“动作因果理解”的转变,是解决 AI 在物理世界中“笨拙”问题的关键一步。

其次,伦理与价值观的重塑。在硅谷日益拥抱国防和军事应用的背景下,General Intuition 明确拒绝“致命自主性”并强调人道主义价值观,为 AI 公司的伦理框架提供了另一种可能性。这不仅关乎品牌形象,更可能影响未来 AI 技术的监管方向和社会接受度。

最后,人机协作的新模式。通过 Nerve 平台,General Intuition 试图将 AI 的发展与现有数字原住民(游戏玩家)的经济利益绑定。这种“技术普惠”的思路,若成功实施,将为解决 AI 时代的就业结构性矛盾提供新的社会实验样本。

尽管挑战依然存在——例如如何将虚拟训练成果无损迁移到复杂的物理世界,以及大规模计算资源的消耗——但 General Intuition 已获得顶级资本和智力资源的背书。它不仅是另一个 AI 初创公司,更可能是构建下一代通用智能体基础设施的重要竞争者。

查看原文 →techcrunch.com