← 返回信息流
AI 资讯雷峰网·2 天前2 源报道

橡木果发布本能驱动技术路线,为机器人赋予具身本能

原标题:橡木果发布“本能驱动”技术路线,为机器人赋予“具身本能”

速览

橡木果机器人发布“本能驱动”技术路线,挑战主流自上而下的数据拟合路径。该方案将任务规划与操作执行解耦,通过Natus模型赋予机器人触觉本能,实现零数据冷启动和硬件自适应。此举旨在解决具身智能在数据规模、算力消耗及泛化迁移方面的核心痛点。

AI 深度解读

背景

在具身智能(Embodied AI)领域,当前的主流技术路径普遍遵循“自上而下”的逻辑:利用大语言模型理解任务,通过海量数据训练端到端的策略网络,试图让机器人通过模仿人类行为来掌握操作技能。这种数据驱动、依赖算力和数据规模扩张(Scaling Law)的模式,在自然语言处理领域取得了巨大成功,但在物理世界的操作执行中却面临严峻挑战。

橡木果机器人(Acorn Robot)由清华大学机械工程博士、哈佛大学神经科学博士后领衔的团队创立。基于跨学科的研究背景,团队发现操作行为与语言行为在底层机制上存在本质差异:语言缺乏先天本能,必须依赖后天环境习得;而全球人类在抓取物体等基础操作上表现出高度一致性,且无需专门教导,这暗示了操作行为背后存在一种“先天本能”。

2024年底成立的橡木果机器人,自2017年起便探索这一非共识路线,并于2025年启动商业化。2026年3月,公司完成近亿元种子轮融资。其核心理念是摒弃单纯的数据拟合,转而通过“自下而上”的方式,赋予机器人类人的操作本能,使其在与物理世界的交互中自主涌现操作智能。

核心内容

橡木果的技术路线核心在于将“任务规划”与“操作执行”彻底解耦,并重新定义了操作智能的底层构建逻辑。

1. 对主流技术路径的反思 当前基于VLA(视觉-语言-动作)端到端架构的路径面临三大困境:

  • 数据规模瓶颈: 操作涉及视觉、触觉、语言多模态,且与硬件特性(电机、传动、手指结构)强耦合。泛化所需数据量呈指数级增长,远超语言模型范畴,任何公司都无法采集覆盖所有硬件和场景的数据。
  • 算力与时延限制: 物理操作要求毫秒级实时响应,无法像大语言模型那样依赖云端进行“慢思考”。边缘端严苛的功耗和时延限制使得纯数据驱动的复杂模型难以落地。
  • 泛化迁移困难: 现有模型“换场景就失灵”,缺乏跨任务、跨本体的通用迁移能力。任务规划(知识层面)与硬件执行(物理适配层面)的逻辑不同,强行耦合在一个黑盒模型中无法解决硬件适配问题。

2. 技术架构:任务与执行解耦 橡木果提出将系统分为两层:

  • 任务规划层: 负责知识推理、任务分解和全局规划。其输出不是具体的电机指令,而是关键图像帧目标和语义约束(如“物体起始位置”、“不要洒”)。
  • 操作执行层: 负责在物理世界中精准、鲁棒地执行任务。这是橡木果的核心突破点,采用“自下而上”的本能驱动路线。

3. 核心模型:Natus 与 Magis 橡木果构建了两个关键模型来实现从“本能”到“技能”的跃迁:

  • Natus(端侧自主决策模型):赋予“具身本能”

    • 定位: 嵌入末端执行器的毫秒级响应模型,实现“零数据冷启动”和“即插即用”。
    • 三大本能:
      1. 定向本能: 结合视觉,指引末端向目标移动。
      2. 探索本能: 接触物体后,通过感知滑移、形变等触觉信息,自主寻找稳定接触构型。这是一种由本能催生的行为涌现,无需预设程序。
      3. 交互本能: 在建立稳定约束后,以“滑移最小化”或“阻抗匹配”为期望,实时调节抓力(如抓豆腐松、抓锤子紧)。
    • 优势: 无需训练数据,依靠触觉反射构建映射,具备硬件自适应能力和毫秒级响应,解决“一上来就会做”的问题。
  • Magis(通用操作技能模型):实现“一上来就熟练”

    • 定位: 基于Natus在真实交互中产生的数据进行训练的技能模型。
    • 数据增强: Natus在操作中记录的不仅是视觉图像,还包括由触觉感知的力学语义(如重量、质心、表面粗糙度、力分布)。这些多模态数据被叠加到视觉数据上,使模型真正理解物理属性。
    • 优势: 大幅降低训练数据需求,提升对未见物体的泛化能力和视觉追踪鲁棒性,解决“越做越熟练”的问题。

4. 硬件基础:完备的触觉感知 本能驱动的前提是完备的触觉信息。橡木果将触觉信息分为三类:

  • 界面信息: 接触界面的分布力、变形、滑移(最关键且最难测量)。
  • 物体信息: 软硬度、摩擦系数、质量、质心等视觉无法获取的属性。
  • 环境信息: 接触位置、刚度、阻抗、扰动等,对装配等任务至关重要。

为此,橡木果自研了第三代视触觉传感器(Vision-based Tactile Sensor)。该传感器采用弹性体加微型相机方案,通过图像重构算法反演多模态触觉信息。其技术壁垒在于动态表征技术(捕捉滑移)、非线性逆问题求解的工程化标定,以及将算法压缩至指尖芯片的算力优化。

关键要点

  • 非共识路线: 橡木果反对“数据填鸭”式的端到端拟合,主张回归物理世界的第一性原理,通过赋予机器人“类人本能”来构建操作能力。
  • 操作本能的存在: 基于神经科学发现,人类操作行为具有先天本能(如抓握的一致性),不受后天语言环境限制,这为机器人操作提供了理论原点。
  • 解耦架构: 将任务规划(自上而下,解决“做什么”)与操作执行(自下而上,解决“怎么做”)分离,避免硬件差异对通用模型的干扰。
  • Natus模型: 端侧自主决策模型,依赖触觉驱动,具备零数据冷启动、硬件自适应、毫秒级响应能力,实现行为的自主涌现。
  • Magis模型: 通用操作技能模型,利用Natus产生的带有丰富触觉语义的数据进行训练,实现跨本体、跨任务的技能迁移和泛化。
  • 触觉为核心: 强调触觉信息(特别是滑移感知)在操作中的决定性作用,自研视触觉传感器以获取界面、物体、环境三类完备信息。
  • 商业化落地: 聚焦工业柔性生产场景(如消费电子、日化),利用Natus的快速适配能力解决“换产频繁、调试耗时”痛点。已在头部化妆品ODM厂商完成POC验证并产生营收。
  • 融资进展: 2026年3月完成近亿元种子轮融资,投资方包括钱唐材料实验室、普华资本等。

意义与影响

橡木果提出的“本能驱动”技术路线,对具身智能行业具有深远的启示意义:

  1. 重塑技术范式: 挑战了当前行业对“大模型+大数据”路径的迷信,证明了在操作执行层面,回归物理规律和底层本能可能比单纯增加算力更有效。它标志着具身智能从“表层多模态输入”向“深层物理理解”的叙事转变。
  2. 解决落地痛点: 通过Natus的“零数据冷启动”和硬件自适应能力,直接解决了工业场景中机器人部署成本高、调试周期长、泛化能力差的现实难题,为具身智能在制造业的规模化应用提供了可行路径。
  3. 构建行业基座: 橡木果旨在成为具身智能的“操作基座”。其理念是上层大模型负责任务规划,下层本能驱动系统负责操作执行,二者通过标准化接口协作。这种分层架构有望成为未来通用具身智能系统的标准范式。
  4. 投资逻辑回归: 橡果果的融资成功表明,资本市场开始从追逐风口叙事,转向关注具备底层技术壁垒、工程化能力和明确商业闭环的硬科技公司。触觉感知、本能驱动等底层能力的价值被重新评估。
  5. 推动硬件创新: 对完备触觉信息的强调,推动了高精度、低成本视触觉传感器的发展,促进了机器人硬件从“视觉主导”向“多模态感知融合”的升级。
查看原文 →leiphone.com