← 返回信息流
AI 资讯量子位·3 小时前

高德发布ABot-Earth0.5:3D原生驱动高一致性场景生成

原标题:高德发布ABot-Earth0.5:跨越2D蒸馏模式,以3D原生驱动高一致性场景生成

速览

高德正式开放内测ABot-Earth0.5,该版本跨越了传统的2D蒸馏模式,采用3D原生技术驱动。这一技术突破旨在显著提升场景生成的一致性,为自动驾驶或数字孪生等领域提供更高质量的3D数据支持。

AI 深度解读

背景

在三维城市建模领域,传统的技术路径长期依赖于“先采集、后拟合”的模式,即通过激光雷达或摄影测量获取数据,再进行三维结构重建。近年来,随着生成式AI的发展,业界曾尝试通过“从2D图像蒸馏3D结构”的方式降低门槛,利用2D大模型的能力间接生成3D内容。然而,这种2D蒸馏模式在空间一致性、几何精度以及大规模场景生成的连续性上存在天然局限。

6月8日,阿里巴巴集团旗下高德地图正式发布了 ABot-Earth0.5。这是全球首个完全基于3D数据训练、且工程可用的3D原生城市世界模型。该模型的发布标志着3D内容生成技术从“2D辅助”向“3D原生”的跨越,旨在解决传统建模成本高、效率低以及现有AI生成方案在空间逻辑上的一致性难题。

核心内容

ABot-Earth0.5 的核心突破在于其彻底摒弃了2D蒸馏路径,采用全3D原生架构。依托高德自有的3D数据积累,该模型实现了城市级3D场景的全AI端到端生成。用户仅需输入一张卫星图或一段文字描述,即可在消费级单卡上快速生成 3DGS(3D Gaussian Splatting,3D高斯溅射)格式的城市场景,生成效率较传统模式提升约1000倍。

为了克服原生3D路径落地的技术难点——即原始3DGS数据难以被大模型高效训练,以及公里级场景连续生成的挑战,高德在以下四个关键环节进行了系统性创新:

  1. 训练环节:压缩-生成框架 模型首创了直接面向3DGS点云的压缩-生成框架。该框架能够将包含数百万基元的高质量真实世界3DGS场景编码到紧凑的隐空间中,并从中生成全新场景。这一创新有效解决了3DGS数据的无序性问题,使模型能够直接“阅读”大体量的3D数据。同时,依托高德自有的三维数据训练,确保了生成内容与真实环境在几何和空间上的一致性。

  2. 推理环节:滑窗推理机制 为实现公里级别的广域生成,ABot-Earth0.5 提出了一种高效的滑窗推理(Sliding-Window Inference)机制。该机制通过在重叠区域进行智能融合,将分块生成的场景一致拼接,实现了公里级广域连续构建,保证了模型生成内容的空间连续性,避免了传统分块生成导致的接缝或逻辑断裂。

  3. 生成阶段:跨域自适应与多层次细节 针对卫星影像与三维训练数据在分辨率上的域差异(Domain Gap),模型引入了跨域自适应模块进行弥合。此外,内置的多层次细节解码器(LOD)使生成结果自带远近景深效果,无需额外后处理即可适配不同视距的流畅漫游需求。

  4. 交付环节:自动化管线与引擎兼容 模型构建了完备的自动化管线,直接输出原生可渲染的3D城市场景。生成的内容可直接导入 UnityUnreal Engine 等主流游戏及仿真引擎,开发者只需添加交互逻辑即可用于实际生产,大幅降低了3D资产的生产门槛。

目前,ABot-Earth0.5 已正式开放内测,用户可通过官方网站提交申请体验。

关键要点

  • 技术范式转移:从“2D图像蒸馏3D”转向“3D原生训练”,直接以3D数据训练模型,建立对三维空间的原生理解。
  • 极致效率:在消费级单卡上运行,生成效率较传统模式提升约1000倍;支持卫星图或文本作为输入。
  • 数据表征创新:首创面向3DGS点云的压缩-生成框架,解决3DGS无序性,实现大体量3D数据的高效编码与生成。
  • 广域生成能力:通过滑窗推理(Sliding-Window Inference)机制,实现公里级场景的连续、无缝拼接。
  • 视觉质量优化:引入跨域自适应模块弥合分辨率差异,利用LOD解码器实现无需后处理的远近景深适配。
  • 工程化落地:输出原生可渲染格式,无缝对接 UnityUnreal Engine 等主流引擎,形成完整的生产闭环。
  • 数据优势:依托高德自有的3D数据积累,确保生成场景与真实环境的几何和空间一致性。

意义与影响

ABot-Earth0.5 的发布对3D内容生产及空间智能领域具有深远意义:

  1. 重构3D生产范式:它证明了“3D原生”大模型在工程上的可行性,打破了长期以来对2D蒸馏技术的依赖,为3D内容生成提供了更高效、更准确的技术路径。
  2. 降低行业门槛:通过将生成效率提升1000倍,并支持在消费级硬件上运行,使得大规模、高精度的3D城市场景生成不再依赖昂贵的专业采集设备和复杂的后期处理流程,极大降低了数字孪生、游戏开发及虚拟仿真领域的成本。
  3. 推动空间智能落地:模型生成的场景具备高度的几何与空间一致性,且可直接接入主流引擎,加速了从“数据”到“可用资产”的转化,为自动驾驶仿真、智慧城市构建及元宇宙应用提供了高质量的底层数据支持。
  4. 确立高德在3D AI领域的领先地位:作为全球首个工程可用的3D原生城市世界模型,ABot-Earth0.5 展示了高德在3D数据积累与AI算法结合方面的深厚实力,进一步巩固了其在全球空间智能技术前沿的位置。
查看原文 →qbitai.com