← 返回信息流
AI 资讯量子位·7 天前

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

速览

该公司提出全球首创的物理AGI“双金字塔”体系,标志着世界模型正接棒语言模型成为技术新焦点。这一突破旨在加速通用机器人的普及,使其真正进入家庭应用场景。行业预期在12个月内有望迎来物理AGI发展的“GPT-3时刻”。

AI 深度解读

背景

在具身智能(Embodied AI)领域,人形机器人虽在舞台上展示了后空翻、跑酷等高难度动作,但公众更关心的是其何时能真正走进家庭,完成端水、洗碗、收纳等日常家务。长期以来,行业面临两大核心痛点:一是数据侧“既要又要还要”的难题,即真机数据精度高但成本高、仿真数据存在虚实迁移鸿沟、互联网视频缺乏动作监督;二是算法侧“小马拉大车”困局,主流视觉-语言-动作(VLA)范式难以有效处理3D空间信息、物理因果逻辑及连续动作编码。

在此背景下,极佳视界(Jiaji Shijie)于5月20日发布新品及最新技术体系。该公司不仅宣布通用人形机器人“拾光S1”进入真实家庭场景进行百台规模化部署,还首次完整披露了其全球首创的物理AGI“双金字塔”技术体系。凭借在三大权威评测中的第一成绩及25亿元的最新融资,极佳视界已跻身国内首个世界模型“百亿独角兽”,试图通过务实的产品路线和系统化的技术方法论,推动物理AGI迎来其“GPT-3时刻”。

核心内容

极佳视界此次发布会的核心在于构建从技术底层到商业落地的完整闭环,具体涵盖技术体系、产品策略、商业化进展及团队资本四大维度。

1. 全球首创物理AGI“双金字塔”技术体系

极佳视界提出了一套解构物理AGI Scaling Law的系统化方案,分为数据金字塔和算法金字塔。

  • 数据金字塔(解决“喂什么”的问题): 将数据源从底到顶划分为五个层级,形成全栈可控的数据闭环:

    • 互联网视频层: 高效复用YouTube、Panda-70M等公开海量数据。
    • 真人数据层: 通过低成本手持数采硬件“U-01”和第一人称视角数采硬件“E-01”获取。
    • 世界模型模拟器层: 自研具身世界模型平台“GigaWorld-0”。
    • 仿真合成数据层: 利用仿真技术生成数据。
    • 真机数据层: 通过家庭版轮臂机器人“拾光S1”及低成本真机数采硬件“Maker M01”获取真实反馈数据。 该体系旨在通过中间三层的工程化能力,弥补单一数据源的缺陷。例如,与清华大学合作的R2RGen技术,仅需1条人类演示即可实现媲美25条真人演示的空间泛化效果,实现了真机数据的高倍率放大。
  • 算法金字塔(解决“怎么学”的问题): 围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径,并在全球三大权威评测中均斩获第一:

    • 世界模拟层(GigaWorld-1): 在WorldArena评测中击败谷歌、英伟达等国际巨头,登顶全球第一,是首个综合得分突破60分的具身世界模型。
    • 动作对齐层: 包含两张王牌。GigaBrain-0系列在RoboChallenge真机评测中力压π0.5等顶流模型获第一;GigaWorld-Policy在面向家庭场景的RoboCasa365中击败NVIDIA GR00T N1.5,成为首个登顶的世界动作模型。
    • 经验强化层(GigaBrain-0.5M):* 结合世界模型与强化学习,跑通了具身基座模型的自我进化,集中突破了世界生成、真机操作和家庭场景泛化三种能力范式。

2. 务实的产品策略:轮臂构型切入家庭场景

  • 硬件形态: 第一代产品“拾光S1”放弃全人形双足路线,采用“下半身轮式底盘+上半身人形双臂”的轮臂构型。这一取舍基于对家庭场景刚需(稳定性、安全性、续航、成本)的深刻理解,而非追求炫技。
  • 核心能力: 搭载自研具身基础模型GigaBrain系列,实现从感知、理解到行动的闭环,能自主识别物体与场景,执行抓取、对齐、折叠、归类等多步骤长程任务。
  • 下一代预告: 2026年第三季度将发布“拾光S2”。其核心升级在于提升“真实家庭可用性”:底盘体积缩小60以适配狭窄空间,续航提升70%并支持热换电,操作范围扩大40%至2.2米高度。

3. 商业化落地与双线并行

  • C端家庭场景: 拾光S1已斩获百台真实家庭场景量产订单,率先部署于武汉光谷之寓社区。
    • 时间表: 5月31日开放公众体验空间;第三季度开启百台规模化运营,并同步发布拾光S2开启创始版预定。
    • 数据价值: 百台机器人在非结构化家庭环境中产生的长周期、多变量、带人类反馈(RLHF)的真机数据,将成为模型迭代的核心资产,解决行业最稀缺的数据痛点。
  • B端工业场景: 联合一汽模具、阿里云完成国内首个具身智能机器人在真实工业制造场景的全流程落地,将传统自动化方案的适配周期从数月压缩至数周。

4. 明确的物理AGI路线图

极佳视界公开了基础模型12个月路线图,量化智能化进程:

  • GigaBrain-1(2026年Q3): 全球首个基于“双金字塔”体系打造的物理AGI基础模型。
  • GigaBrain-2: 进一步拉满Scaling Law的加速器。
  • GigaBrain-3: 基于1000万小时视频数据+100万小时世界-动作数据训练,剑指物理AGI的“GPT-3时刻”,即通过数据与算力跨越阈值,实现物理智能体的真正通用性和自我进化能力。

5. 团队与资本

  • 核心团队: 汇聚了来自清华、地平线、阿里云、百度Apollo等顶尖机构的专家。CEO黄冠(清华博士,前地平线、鉴智机器人高管)、首席科学家朱政(智源青年学者,顶级论文作者)、联合创始人孙韶言(前阿里云总监,主导智能驾驶数据闭环)、合伙人毛继明(前百度Apollo仿真负责人)。团队完整经历了CV、自动驾驶、具身基模等技术演进。
  • 资本认可: 2026年3月至4月完成两轮融资,合计约25亿元,投资方涵盖华为哈勃等顶尖产业资本、头部财务机构及国资平台。

关键要点

  • 技术首创性: 极佳视界全球首创物理AGI“双金字塔”体系,系统性解决了具身智能在数据源多样性与算法处理3D物理逻辑上的双重瓶颈。
  • 评测成绩: 在世界模拟、动作对齐、经验强化三个关键层级,均在各自领域的全球权威评测中排名第一,超越了谷歌、英伟达、Tesla等巨头的相关模型。
  • 务实落地路径: 摒弃不稳定的全人形双足路线,采用轮臂构型“拾光S1”切入家庭场景,强调稳定性、安全性和成本优势,更符合当前家庭家务的刚需。
  • 数据飞轮效应: 百台机器人进入真实家庭社区,旨在获取实验室无法模拟的非结构化、长周期、带人类反馈的真机数据,这是模型迭代的核心燃料。
  • 明确的时间表: 提出了清晰的12个月路线图,目标在2026年Q3发布GigaBrain-1,并在12个月内通过GigaBrain-3触及物理AGI的“GPT-3时刻”(涌现能力临界点)。
  • 双线商业矩阵: C端家庭场景求“广”,积累数据资产;B端工业场景求“深”,树立标杆落地,形成互补的商业闭环。
  • 顶级团队背书: 核心团队具备深厚的学术背景与产业落地经验,覆盖从算法、数据闭环到仿真工程的完整链条。

意义与影响

极佳视界的发布标志着具身智能行业从“实验室演示”向“真实场景规模化应用”的关键转折。

查看原文 →qbitai.com