AI 资讯雷峰网·2 天前2 源报道

橡木果发布本能驱动技术路线，为机器人赋予具身本能

原标题：橡木果发布“本能驱动”技术路线，为机器人赋予“具身本能”

速览

橡木果机器人发布“本能驱动”技术路线，挑战主流自上而下的数据拟合路径。该方案将任务规划与操作执行解耦，通过Natus模型赋予机器人触觉本能，实现零数据冷启动和硬件自适应。此举旨在解决具身智能在数据规模、算力消耗及泛化迁移方面的核心痛点。

AI 深度解读

背景

在具身智能（Embodied AI）领域，当前的主流技术路径普遍遵循“自上而下”的逻辑：利用大语言模型理解任务，通过海量数据训练端到端的策略网络，试图让机器人通过模仿人类行为来掌握操作技能。这种数据驱动、依赖算力和数据规模扩张（Scaling Law）的模式，在自然语言处理领域取得了巨大成功，但在物理世界的操作执行中却面临严峻挑战。

橡木果机器人（Acorn Robot）由清华大学机械工程博士、哈佛大学神经科学博士后领衔的团队创立。基于跨学科的研究背景，团队发现操作行为与语言行为在底层机制上存在本质差异：语言缺乏先天本能，必须依赖后天环境习得；而全球人类在抓取物体等基础操作上表现出高度一致性，且无需专门教导，这暗示了操作行为背后存在一种“先天本能”。

2024年底成立的橡木果机器人，自2017年起便探索这一非共识路线，并于2025年启动商业化。2026年3月，公司完成近亿元种子轮融资。其核心理念是摒弃单纯的数据拟合，转而通过“自下而上”的方式，赋予机器人类人的操作本能，使其在与物理世界的交互中自主涌现操作智能。

核心内容

橡木果的技术路线核心在于将“任务规划”与“操作执行”彻底解耦，并重新定义了操作智能的底层构建逻辑。

1. 对主流技术路径的反思 当前基于VLA（视觉-语言-动作）端到端架构的路径面临三大困境：

数据规模瓶颈： 操作涉及视觉、触觉、语言多模态，且与硬件特性（电机、传动、手指结构）强耦合。泛化所需数据量呈指数级增长，远超语言模型范畴，任何公司都无法采集覆盖所有硬件和场景的数据。
算力与时延限制： 物理操作要求毫秒级实时响应，无法像大语言模型那样依赖云端进行“慢思考”。边缘端严苛的功耗和时延限制使得纯数据驱动的复杂模型难以落地。
泛化迁移困难： 现有模型“换场景就失灵”，缺乏跨任务、跨本体的通用迁移能力。任务规划（知识层面）与硬件执行（物理适配层面）的逻辑不同，强行耦合在一个黑盒模型中无法解决硬件适配问题。

2. 技术架构：任务与执行解耦 橡木果提出将系统分为两层：

任务规划层： 负责知识推理、任务分解和全局规划。其输出不是具体的电机指令，而是关键图像帧目标和语义约束（如“物体起始位置”、“不要洒”）。
操作执行层： 负责在物理世界中精准、鲁棒地执行任务。这是橡木果的核心突破点，采用“自下而上”的本能驱动路线。

3. 核心模型：Natus 与 Magis 橡木果构建了两个关键模型来实现从“本能”到“技能”的跃迁：

Natus（端侧自主决策模型）：赋予“具身本能”
- 定位： 嵌入末端执行器的毫秒级响应模型，实现“零数据冷启动”和“即插即用”。
- 三大本能：
  1. 定向本能： 结合视觉，指引末端向目标移动。
  2. 探索本能： 接触物体后，通过感知滑移、形变等触觉信息，自主寻找稳定接触构型。这是一种由本能催生的行为涌现，无需预设程序。
  3. 交互本能： 在建立稳定约束后，以“滑移最小化”或“阻抗匹配”为期望，实时调节抓力（如抓豆腐松、抓锤子紧）。
- 优势： 无需训练数据，依靠触觉反射构建映射，具备硬件自适应能力和毫秒级响应，解决“一上来就会做”的问题。
Magis（通用操作技能模型）：实现“一上来就熟练”
- 定位： 基于Natus在真实交互中产生的数据进行训练的技能模型。
- 数据增强： Natus在操作中记录的不仅是视觉图像，还包括由触觉感知的力学语义（如重量、质心、表面粗糙度、力分布）。这些多模态数据被叠加到视觉数据上，使模型真正理解物理属性。
- 优势： 大幅降低训练数据需求，提升对未见物体的泛化能力和视觉追踪鲁棒性，解决“越做越熟练”的问题。

4. 硬件基础：完备的触觉感知 本能驱动的前提是完备的触觉信息。橡木果将触觉信息分为三类：

界面信息： 接触界面的分布力、变形、滑移（最关键且最难测量）。
物体信息： 软硬度、摩擦系数、质量、质心等视觉无法获取的属性。
环境信息： 接触位置、刚度、阻抗、扰动等，对装配等任务至关重要。

为此，橡木果自研了第三代视触觉传感器（Vision-based Tactile Sensor）。该传感器采用弹性体加微型相机方案，通过图像重构算法反演多模态触觉信息。其技术壁垒在于动态表征技术（捕捉滑移）、非线性逆问题求解的工程化标定，以及将算法压缩至指尖芯片的算力优化。

关键要点

非共识路线： 橡木果反对“数据填鸭”式的端到端拟合，主张回归物理世界的第一性原理，通过赋予机器人“类人本能”来构建操作能力。
操作本能的存在： 基于神经科学发现，人类操作行为具有先天本能（如抓握的一致性），不受后天语言环境限制，这为机器人操作提供了理论原点。
解耦架构： 将任务规划（自上而下，解决“做什么”）与操作执行（自下而上，解决“怎么做”）分离，避免硬件差异对通用模型的干扰。
Natus模型： 端侧自主决策模型，依赖触觉驱动，具备零数据冷启动、硬件自适应、毫秒级响应能力，实现行为的自主涌现。
Magis模型： 通用操作技能模型，利用Natus产生的带有丰富触觉语义的数据进行训练，实现跨本体、跨任务的技能迁移和泛化。
触觉为核心： 强调触觉信息（特别是滑移感知）在操作中的决定性作用，自研视触觉传感器以获取界面、物体、环境三类完备信息。
商业化落地： 聚焦工业柔性生产场景（如消费电子、日化），利用Natus的快速适配能力解决“换产频繁、调试耗时”痛点。已在头部化妆品ODM厂商完成POC验证并产生营收。
融资进展： 2026年3月完成近亿元种子轮融资，投资方包括钱唐材料实验室、普华资本等。

意义与影响

橡木果提出的“本能驱动”技术路线，对具身智能行业具有深远的启示意义：

重塑技术范式： 挑战了当前行业对“大模型+大数据”路径的迷信，证明了在操作执行层面，回归物理规律和底层本能可能比单纯增加算力更有效。它标志着具身智能从“表层多模态输入”向“深层物理理解”的叙事转变。
解决落地痛点： 通过Natus的“零数据冷启动”和硬件自适应能力，直接解决了工业场景中机器人部署成本高、调试周期长、泛化能力差的现实难题，为具身智能在制造业的规模化应用提供了可行路径。
构建行业基座： 橡木果旨在成为具身智能的“操作基座”。其理念是上层大模型负责任务规划，下层本能驱动系统负责操作执行，二者通过标准化接口协作。这种分层架构有望成为未来通用具身智能系统的标准范式。
投资逻辑回归： 橡果果的融资成功表明，资本市场开始从追逐风口叙事，转向关注具备底层技术壁垒、工程化能力和明确商业闭环的硬科技公司。触觉感知、本能驱动等底层能力的价值被重新评估。
推动硬件创新： 对完备触觉信息的强调，推动了高精度、低成本视触觉传感器的发展，促进了机器人硬件从“视觉主导”向“多模态感知融合”的升级。

查看原文 →leiphone.com

橡木果发布本能驱动技术路线，为机器人赋予具身本能

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐