AI 资讯TechCrunch AI·2 小时前2 源报道

General Intuition融资3.2亿美元押注游戏训练AI直觉

原标题：General Intuition raises $2.3B on bet that video games can train AI agents for the real world

速览

General Intuition宣布完成3.2亿美元融资，旨在扩大基于数百万小时游戏画面训练的AI规模。该公司押注动作数据能帮助AI发展出更接近人类直觉的能力。这一进展标志着利用游戏环境模拟现实世界智能的新尝试。

AI 深度解读

General Intuition 融资 3.2 亿美元：以电子游戏为跳板，训练具备“直觉”的通用 AI 智能体

背景

在人工智能领域，如何训练出能够理解物理世界、具备因果推理能力的通用智能体（AI Agents），一直是行业面临的巨大挑战。大多数现有方法依赖大量昂贵且缓慢收集的现实世界数据，或者仅通过视频推断动作，缺乏对“自我”与“环境”交互的深刻理解。

在此背景下，General Intuition 应运而生。该公司由 31 岁的 Pim de Witte 联合创立，其前身是游戏视频分享平台 Medal。Medal 积累了数亿小时的游戏游玩数据，这为 General Intuition 提供了独特的训练素材。2024 年 10 月，该公司以 1.34 亿美元的首轮融资启动。近日，General Intuition 宣布完成新一轮融资，旨在利用游戏数据中的“动作标签”来训练具备空间时间推理能力和类人直觉的 AI 模型，并将其应用于机器人控制和模拟环境。

核心内容

General Intuition 的核心愿景是打造一个能够从游戏游玩数据泛化到模拟环境，最终应用于实体机器人的通用智能体模型。这一理念通过其纽约办公室的研发场景得到了直观体现：一个由 AI 驱动的机器狗在办公室内自由行走，其背后的“大脑”与正在玩《Fortnite》（堡垒之夜）的 AI 智能体是同一个模型。

数据优势与训练逻辑 General Intuition 并非从零开始收集数据，而是利用了其前身 Medal 平台积累的数亿小时游戏视频。然而，创始人 Pim de Witte 指出，关键 ingredient（关键要素）并非视频画面本身，而是嵌入在视频中的“动作标签”（Action Labels），即玩家按下哪些按钮以及何时按下。

De Witte 认为，大多数竞争对手试图仅从视频中推断动作，这是不充分的。General Intuition 的方法是将此视为“未来预训练”的下一个阶段。通过结合屏幕上的游戏信息与真实世界的动态，模型能够以一种大型语言模型（LLM）无法做到的方式做出反应。这种基于动作数据的学习，帮助模型区分“自我”与“环境”，从而建立起更丰富的因果理解。

技术演示与“世界模型” 在演示中，General Intuition 展示了一个名为“世界模型”（World Model）的系统。与传统游戏引擎不同，该环境是逐帧生成的。测试者发现，AI 智能体能够准确识别墙壁、梯子和光影变化，不会像其他一些演示中的智能体那样穿墙而过。

值得注意的是，这个“世界模型”并非最终产品，而是内部称为“健身房”（the gym）的训练环境。公司最终目标是销售具备行动能力的智能体模型。数据显示，仅需 8 分钟的真实世界机器人数据，即可对该模型进行微调，使其适应四足机器人。有趣的是，这些微调数据是在街道上收集的，而非在办公室环境中，证明了模型强大的泛化能力。

融资情况与资金用途 General Intuition 近日宣布以 23 亿美元的估值融资 3.2 亿美元，使其总披露融资额达到 4.54 亿美元。本轮融资由 Khosla Ventures 领投，General Catalyst、Jeff Bezos（杰夫·贝佐斯）、Eric Schmidt（埃里克·施密特）、Nico Rosberg（尼科·罗斯伯格）以及 Google DeepMind 和 MIT 的研究人员参投。

筹集的资金将主要用于扩大计算能力。公司已与 CoreWeave 达成协议，重点预训练下一代模型。此外，部分资金将用于在夏季结束前更广泛地开放其 API。

伦理立场与公司愿景 General Intuition 的投资者，尤其是领投方 Khosla Ventures 的 Vinod Khosla，认为这是一家“世代级”的公司，而非潜在的并购目标。Khosla 指出，LLM 的量子飞跃在于“推理”的出现，而世界模型的量子飞跃在于 AI “直觉”的涌现，游戏中的动作和反应数据正是这种直觉涌现的关键。

创始人 Pim de Witte 具有人道主义工作背景（曾与无国界医生合作），因此为技术设定了明确的伦理红线：绝不开发用于伤害人类的智能体，拒绝参与“致命自主性”（lethal autonomy）的研发。他批评硅谷日益增长的军事化倾向，并强调团队中许多成员来自欧洲，持有不同的价值观。

为了应对 AI 可能带来的就业冲击，General Intuition 最近推出了名为 Nerve 的平台，这是一个面向游戏玩家的就业市场。玩家可以利用现有设备参与数据标注，并逐步过渡到机器人远程操作等任务。De Witte 认为，Medal 的用户群体正是最容易受到 AI 驱动替代影响的一代，他希望他们能从中获益。

关键要点

巨额融资与高估值：General Intuition 以 23 亿美元估值完成 3.2 亿美元融资，总融资额达 4.54 亿美元。投资方包括 Khosla Ventures、Jeff Bezos、Eric Schmidt 及多家顶级学术机构。
独特数据壁垒：核心优势在于 Medal 平台积累的数亿小时游戏数据，特别是其中包含的精确“动作标签”（玩家按键记录），这比单纯的视频数据更能帮助 AI 理解因果关系。
技术路径创新：
- 不依赖昂贵的现实世界大规模数据采集，而是通过游戏数据作为可扩展的捷径。
- 构建“世界模型”作为训练环境（Gym），让 AI 学习空间、时间及物理规律（如墙壁不可穿越）。
- 仅需少量（如 8 分钟）真实世界数据即可对模型进行微调，实现从虚拟到现实的泛化。
产品定位：公司不直接开发最终应用（如自动驾驶汽车），而是作为底层模型提供商（类似 Anthropic 或 OpenAI），出售具备行动能力的智能体模型，并计划开放 API。
明确的伦理边界：创始人 Pim de Witte 坚持非军事化立场，拒绝开发用于伤害人类的智能体，这与当前硅谷部分企业的军事化趋势形成鲜明对比。
社会责任感：推出 Nerve 平台，利用现有游戏玩家群体参与 AI 数据标注和机器人操作，试图缓解 AI 带来的就业替代焦虑，让受影响群体分享技术红利。
行业共识：投资者认为，世界模型的下一个“量子飞跃”是 AI “直觉”的涌现，而游戏中的交互数据是培养这种直觉的关键。

意义与影响

General Intuition 的崛起标志着 AI 训练范式的一个潜在转折点。长期以来，具身智能（Embodied AI）的发展受限于现实世界数据获取的高成本和低效率。General Intuition 提出的“游戏即捷径”假设，如果能在大规模物理世界中得到验证，将极大地降低训练通用智能体的门槛。

首先，数据效率的革命。通过利用游戏中蕴含的丰富因果逻辑和动作反馈，General Intuition 试图证明虚拟环境可以成为现实世界机器人训练的高效模拟器。这种从“视频理解”到“动作因果理解”的转变，是解决 AI 在物理世界中“笨拙”问题的关键一步。

其次，伦理与价值观的重塑。在硅谷日益拥抱国防和军事应用的背景下，General Intuition 明确拒绝“致命自主性”并强调人道主义价值观，为 AI 公司的伦理框架提供了另一种可能性。这不仅关乎品牌形象，更可能影响未来 AI 技术的监管方向和社会接受度。

最后，人机协作的新模式。通过 Nerve 平台，General Intuition 试图将 AI 的发展与现有数字原住民（游戏玩家）的经济利益绑定。这种“技术普惠”的思路，若成功实施，将为解决 AI 时代的就业结构性矛盾提供新的社会实验样本。

尽管挑战依然存在——例如如何将虚拟训练成果无损迁移到复杂的物理世界，以及大规模计算资源的消耗——但 General Intuition 已获得顶级资本和智力资源的背书。它不仅是另一个 AI 初创公司，更可能是构建下一代通用智能体基础设施的重要竞争者。

查看原文 →techcrunch.com