← 返回信息流
AI 资讯量子位·1 天前

跨维智能登顶WorldArena,世界模型榜首易主

原标题:世界模型榜首易主!跨维智能登顶WorldArena

速览

跨维智能(Cross-Dimensional Intelligence)近日在WorldArena榜单中登顶,标志着世界模型领域的竞争格局发生重要变化。该榜单旨在评估大模型在构建和理解物理世界方面的能力,此次易主反映了跨维智能在相关技术上的显著进展。这一结果对AI行业探索具身智能和通用人工智能具有重要参考意义。

AI 深度解读

背景

在英伟达(Nvidia)、谷歌(Google)及 OpenAI 等全球科技巨头深度布局的世界模型(World Models)赛道中,竞争日益激烈。世界模型作为具身智能(Embodied AI)的核心技术之一,旨在让 AI 理解物理世界的动态变化、因果逻辑及空间关系,从而赋能机器人等实体智能体的决策与行动。

为了甄别模型的真实能力并引领产业发展,由全球顶尖高校及科研机构权威专家打造的 WorldArena 成为目前该赛道最权威的评测基准。该榜单以严苛的评测体系著称,构建了包含 16 项细分核心指标和 3 大真实应用任务的立体化评估体系,全方位考察模型的感知精度、物理规律理解、三维空间认知以及动作预测与实际落地能力。

近日,WorldArena 公布了截至 5 月 25 日的最新榜单。中国具身智能公司 跨维智能(DexForce) 凭借自研模型 DSCFuncWorld,在最具实战价值的 Track 2(Data Engine,数据引擎) 赛道中登顶全球第一,大幅刷新了该赛道的最高分,显著领先于第二名及 WoW、BLM 等国际知名模型。

核心内容

1. WorldArena 评测体系与赛道解析

WorldArena 设立了两大核心赛道,其能力定位截然不同:

  • Track 1:侧重视觉画面、动态效果、物理一致性等感知表现,偏向于可视化技术的展示。
  • Track 2 (Data Engine):这是本次跨维智能登顶的赛道,也是衡量模型产业价值的硬核标尺。该赛道不比拼画面是否逼真,而是核心考核世界模型作为数据合成引擎策略评估工具行动规划载体的全链路落地能力。

在 Track 2 中,参赛模型需依托初始场景观测与文本指令,自主模拟完整的机器人交互流程,生成高质量训练数据。最终评判标准是机器人实际作业任务的成功率,以此检验世界模型在数据生成、策略训练、任务落地全链路的硬实力。

2. 跨维智能的突破:DSCFuncWorld 登顶

跨维智能此次冲榜的模型为 DSCFuncWorld,属于其自研的 Dex系列 模型。该模型基于跨维智能自研的核心底座 DexWorldModel 进行简单适配而来。

DSCFuncWorld 在 Track 2 赛道中展现出显著优势:

  • 技术原理:主打因果隐空间建模,依托 DINO 语义特征空间精准建模未来世界状态。它重点强化了对环境纹理、物体关联及物理规则的鲁棒表达。
  • 落地能力:模型能够将虚拟推演结果高效转化为可用的机器人训练资产。其生成的推演过程、场景轨迹与真实机器人任务高度契合,且严格遵循物理规则与机器人运动逻辑,具备极强的可操作性,能够有效支撑策略模型的迭代优化。
  • 成绩表现:不仅登顶全球第一,更与第二名拉开显著比分差距,证明了其在环境推演、物理认知及工程落地方面的行业顶尖实力。

3. 底层技术闭环:数据与模型双轮驱动

跨维智能的此次突破并非单点偶然,而是长期深耕底层技术、坚持数据与模型双轮驱动的结果。其核心竞争力体现在解决行业普遍存在的“视觉逼真但无法落地”的可执行性缺口。

  • EVA 技术框架:此前团队推出的 EVA (Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards) 技术框架,通过逆动力学奖励机制对齐视频生成与机器人可执行动作,确保模型生成的推演轨迹贴合真实机器人作业逻辑。
  • EmbodiChain 具身数据基建:依托自研的 EmbodiChain 平台,跨维智能构建了覆盖资产生成、场景布局、可达轨迹采样、失败案例恢复、在线数据回流的完整数据体系。这一体系持续产出物理可信、场景多元、任务覆盖全面的高质量训练数据,大幅提升了合成数据对机器人策略训练的赋能效果与场景泛化能力。

关键要点

  • 榜首易主:跨维智能(DexForce)在 WorldArena 权威榜单的 Track 2(Data Engine)赛道登顶全球第一,超越英伟达、谷歌等巨头布局的模型,以及 WoW、BLM 等国际旗舰模型。
  • 赛道差异:WorldArena 的 Track 2 侧重“数据引擎”的实战落地能力,核心考核模型生成数据用于机器人策略训练和任务执行的成功率,而非单纯的视觉生成质量。
  • 模型架构:登顶模型 DSCFuncWorld 基于自研底座 DexWorldModel,采用因果隐空间建模和 DINO 语义特征空间,强化了对物理规则和物体关联的表达。
  • 解决痛点:通过 EVA 技术框架(逆动力学奖励对齐)和 EmbodiChain 数据基建,跨维智能解决了世界模型“看得见但动不了”的行业瓶颈,实现了从虚拟推演到真实机器人动作的有效迁移。
  • 全链路闭环:跨维智能构建了从数据生成、仿真训练闭环、策略赋能到虚实迁移的全链路技术实力,验证了其作为具身数据引擎和策略评估工具的核心价值。

意义与影响

1. 验证了具身智能落地的新路径

此次登顶标志着世界模型的评价标准从“视觉表现”向“实用价值”转移。跨维智能的成功证明,世界模型的核心竞争力在于其作为数据合成引擎和策略评估工具的能力,即能否生成可训练、可迁移、可执行的高质量数据,从而加速通用具身智能的产业化进程。

2. 中国公司在硬核科技赛道的突围

在世界模型这一由英伟达、谷歌等全球科技巨头重兵把守的核心腹地,跨维智能实现了强势突围并登顶榜首。这不仅展示了中国 AI 公司在底层算法和工程落地方面的强劲实力,也表明中国具身智能企业已稳居全球第一梯队,具备与国际顶尖水平同台竞技并领先的能力。

3. 推动行业从概念内卷转向务实落地

跨维智能强调“不和概念赛跑,和真实世界赛跑”。其技术路线跳出了单纯追求画面逼真度的内卷,直击具身智能落地过程中最棘手的系统性难题——即如何让 AI 理解并执行物理世界中的复杂任务。这种务实的态度和技术积累,为行业提供了从理论模型走向真实物理世界的关键短板补齐方案,有助于推动具身智能从实验室走向规模化商业应用。

查看原文 →qbitai.com