← 返回信息流
AI 资讯量子位·12 小时前

戴盟机器人完成亿元融资,阿里通义专家加盟攻关物理世界模型

原标题:戴盟机器人完成亿元融资,阿里通义多模态大牛加盟攻关物理世界模型

速览

戴盟机器人宣布完成亿元级别融资。阿里通义多模态领域专家加盟,将重点攻关物理世界模型。此举旨在摆脱视觉内卷,推动具身智能在物理交互领域的突破。

AI 深度解读

背景

具身智能(Embodied AI)领域近期持续受到资本市场的热烈追捧,热钱不断涌入。在这一背景下,具身智能公司戴盟机器人(Daimon Robotics)近日完成了亿元级别的A轮融资。本轮融资由汇川产投和中国电信联合投资。

值得注意的是,此次融资不仅标志着资金的注入,更折射出行业在技术路线选择上的分化。当视觉、多模态、VLA(视觉-语言-动作模型)和世界模型成为行业热议焦点时,戴盟机器人选择了一条差异化路径——聚焦“触觉”这一被忽视的关键维度。与此同时,公司引入了关键人才:阿里通义实验室前多模态研究专家原玮浩博士加盟,担任首席AI科学家,进一步夯实了其在物理世界模型领域的研发实力。

核心内容

戴盟机器人本轮融资的主要用途明确指向三个核心方向:物理世界模型的研发、包含物理交互信息的超大规模数据集构建,以及在真实场景下建立数据飞轮和商业闭环。首席AI科学家原玮浩将这些要素比喻为“数据是燃料,物理世界模型是引擎,飞轮决定引擎能不能持续跑起来”。其中,物理世界模型是后续布局的重中之重。

戴盟对“物理世界模型”有着独特的定义。不同于传统视频世界模型仅预测下一帧画面的变化,戴盟的模型以多模态接触状态为条件来预测未来。它不仅关注视觉画面的变化,更重点预测下一刻的触觉信号、接触状态,以及操作是否会失败、失败原因及修正策略。原玮浩将其总结为:“视频世界模型在预测画面,我们在预测物理交互。”

为了实现这一目标,戴盟将物理接触机制拆分为两层:

  1. 认知层:实现触觉与视觉、语言、几何等模态在同一表征空间内的映射。例如,通过视觉直接预判触觉策略,区分对待葡萄(需轻柔包裹)和玻璃珠(可用力捏起)的不同操作逻辑。
  2. 执行层:包含两套并行机制。
    • 高频触觉伺服:类似脊髓反射,在毫秒级时间内发出补偿动作,应对物体滑移趋势,速度远超纯视觉模型的反应能力。
    • 物理世界推理:模型持续预测未来接触状态,在失误发生前提前给出修正策略。

戴盟强调,触觉不应仅被视为辅助传感器,而是贯穿感知、决策、控制三层的“Physical AI”理解真实世界的关键入口。视觉和语言仅是物理世界的低维映射,而触觉作为原生物理模态,能捕捉物体软硬、表面粗糙度、正压力和切向力等关键信息,赋予语言和视觉真正的物理意义。

在数据层面,戴盟面临规模化采集和多模态对齐两大挑战。为解决数据问题,戴盟搭建了外发式数据采集网络,将标准化采集模组部署至产业合作方场景。今年4月,戴盟联合Google DeepMind等数十家机构发布了全球规模最大的含触觉全模态具身数据集 Daimon-Infinity。此外,戴盟与银河通用联合发布了行业首个支持真实数据与仿真训练的含触觉全模态物理交互评测基准 RobOmni,旨在为触觉 Scaling Law 的验证建立公认标准。

关键要点

  • 融资与人才:戴盟机器人完成亿元A轮融资,由汇川产投和中国电信投资;阿里通义实验室前专家原玮浩博士出任首席AI科学家,带来多模态大模型及世界模型迁移至机器人操作的前沿经验。
  • 技术差异化:在行业普遍聚焦视觉和内卷时,戴盟选择“触觉”为核心路线,主张触觉是理解物理世界的关键入口,而非辅助传感器。
  • 物理世界模型定义:区别于仅预测画面变化的视频世界模型,戴盟的模型预测包括触觉信号、接触状态及操作成败在内的物理交互全过程。
  • 双层执行架构
    • 认知层:实现视觉到触觉预判的直接映射。
    • 执行层:结合毫秒级高频触觉伺服(边缘力控)与物理世界推理(前瞻修正),协同应对物理交互中的不确定性。
  • 数据基础设施
    • 发布全球最大含触觉全模态具身数据集 Daimon-Infinity。
    • 发布首个含触觉全模态物理交互评测基准 RobOmni,旨在推动触觉 Scaling Law 的研究与标准化。
  • 行业洞察:具身智能路线正在分化,戴盟致力于补齐机器人与物理世界接触时的信息缺口,解决纯视觉模型在物理规律理解上的局限。

意义与影响

戴盟机器人的动作反映了具身智能行业从“感知智能”向“物理智能”深化的趋势。随着大模型在视觉和语言领域的成熟,瓶颈逐渐转移至机器人与真实物理世界的交互能力上。纯视觉方案在处理软体、易碎品或需要精细力控的场景时存在天然局限,而触觉信息的引入能够显著填补这一数据缺口,提升机器人的操作鲁棒性和泛化能力。

原玮浩的加盟以及阿里通义实验室背景人才的引入,表明头部AI企业正在加速将大模型能力向具身智能领域迁移。戴盟提出的“触觉 Scaling Law”概念及配套的评测基准 RobOmni,若能得到行业验证,将有助于建立统一的评估体系,加速触觉智能从实验走向规模化应用。

此外,汇川产投和中国电信的入局,显示出传统制造业巨头和电信运营商对具身智能基础设施及落地场景的高度重视。这不仅为戴盟提供了算力与场景支持,也预示着具身智能将与工业互联网、智能制造等实体经济领域产生更紧密的融合。戴盟在物理世界模型和数据飞轮上的投入,有望为解决机器人“最后一公里”的操作难题提供新的技术范式。

查看原文 →qbitai.com