← 返回信息流
AI 资讯雷峰网·3 小时前

魔法原子首秀VLA K02大模型,实现具身智能从执行到理解跃迁

原标题:魔法原子上交会首秀VLA K02大模型,完成具身智能从“执行”到“理解”的能力跃迁

速览

魔法原子在第十二届上海技贸会上首次发布自研Magic-VLA K02大模型与Magic-Mix世界模型。该模型采用分层式双系统联合架构,突破了传统VLA模型局限,使机器人能自主拆解并精准完成叠衣服等高难度长序任务。此举标志着具身智能从单纯“执行”向深度“理解”的能力跃迁,验证了全栈自研技术体系的成熟。

AI 深度解读

背景

6月13日,第十二届中国(上海)国际技术进出口交易会(CSITF)在上海闭幕。作为全球具身智能领域的领军企业,魔法原子(MagicLab)携全栈技术矩阵重磅亮相。此次展会不仅是魔法原子全家族明星产品的沉浸式动态展示平台,更是其两大核心技术成果——自研 Magic-VLA K02 大模型与 Magic-Mix 世界模型——首次在国内公开发布的场合。这一“双模型”线下首秀,标志着魔法原子“智能大脑”核心能力的首次公开呈现,同时也意味着其全栈自研技术体系的全面升级。

核心内容

在展会现场,魔法原子展示了 MagicBot Gen1 通用人形机器人、Z1 高动态双足机器人、MagicDog 系列四足机器狗及智能咖啡机器人,覆盖工业、商业及家庭等多元场景。其中,搭载 Magic-VLA K02 与 Magic-Mix 世界模型的机器人完成了叠衣服、叠盒子等高难度长序作业任务演示。面对衣物柔性形变、多阶段精密操作以及环境光线变化、物体位置移动等动态干扰,机器人展现了稳定的感知、纠错与闭环执行能力。

针对行业痛点,魔法原子构建了分层式双系统联合架构,并配套 Magic-Mix 世界模型以解决数据瓶颈。

Magic-VLA K02:分层式通用具身智能大模型 区别于传统 VLA 大模型“指令即动作”的线性执行局限,Magic-VLA K02 专为机器人长程复杂任务打造,采用“双层中枢、分工协同”的核心架构:

  • 高层系统(宏观规划中枢): 依托理解-生成统一模型,将用户抽象化的全局目标拆解为包含关键结果图像的精细化原子指令。通过动态记忆更新机制实时修正任务路径,规避决策偏差。
  • 低层系统(动作执行中枢): 融合 VLM 主干网络与动态专家模块,利用潜在未来状态预测机制预判场景演变,结合扩散生成技术输出平稳无抖动的连续动作,保障作业精准落地。

这种“规划与执行解耦”的设计,使机器人具备“知其然、更知其所以然”的高阶具身智能。

Magic-Mix 世界模型:数据引擎突破 Magic-Mix 世界模型搭载 WAM 环境解析引擎与 Creator 数据生成引擎,能够高效解读非结构化复杂环境,并自主合成百万小时级高质量训练数据。这一技术将数据生产效率提升万倍,突破了具身智能行业高质量训练数据稀缺、迭代效率低的核心瓶颈。

训练与推理体系 为支撑高精度系统运转,魔法原子创新搭建“海量第一人称视角预训练+少量机器人示范对齐”的训练体系。模型历经四阶段分层训练打磨,搭配“认知-执行-适配”三阶高效推理流程,在超大算力消耗与终端极致实时性需求之间实现了最优平衡。

关键要点

  • 四大核心竞争优势:
    • 极强的策略可控性: 通过动态记忆实时迭代任务进度与规划逻辑,解决传统模型长程任务中的进度遗忘与路径固化问题。
    • 高阶组合泛化能力: 基于原子动作自由重组逻辑,无需专项示范数据,即可零样本适配各类全新复杂任务。
    • 全域跨本体适配性: 创新引入元数据描述体系,可无缝适配机械臂、人形机器人等多类硬件终端。
    • 高稳定落地部署能力: 凭借分层约束机制与自适应容错算法,在抓取失败或场景突变下可自动重试与动态调整,降低真机实测数据依赖。
  • 攻克柔性物体与长序任务难题: 成功解决衣物折叠中的不可预判连续形变问题,以及叠盒子任务中细微动作偏差在长流程中的指数级累积问题。
  • 数据效率革命: 通过 Magic-Mix 世界模型自主合成数据,将训练数据生产效率提升万倍,为长序稳定作业提供坚实技术底座。
  • 全栈自研体系成熟: 从机器人本体、核心零部件到具身大模型、世界模型,魔法原子完成了“本体+模型+数据”协同发展的技术路线闭环。

意义与影响

Magic-VLA K02 与 Magic-Mix 世界模型的首次线下公开展示,验证了魔法原子在具身智能核心技术领域的持续突破。其分层式双系统联合架构彻底突破了传统 VLA 模型的线性执行局限,实现了从“执行”到“理解”的能力跃迁,标志着具身智能从单点能力突破迈向通用作业能力升级。

展望未来,魔法原子将持续加大在基础模型、世界模型及场景应用层面的研发投入,推动具身智能产业加速走向真实世界,为工业制造、商业服务及家庭场景提供更智能、稳定且具规模化落地价值的机器人解决方案。

查看原文 →leiphone.com