复旦系具身智能新星获近亿元天使轮,打造机器人触觉梦之队
速览
复旦系具身智能领域新星宣布完成近亿元天使轮融资,旨在打造机器人触觉感知的“梦之队”。该项目致力于让机器人突破视觉局限,真正掌握“触摸”技能,实现更精细的操作与交互。此举标志着具身智能在感知维度上的重要突破,有望推动机器人技术在复杂场景中的落地应用。
AI 深度解读
背景
过去两年,具身智能(Embodied AI)领域的资源投入与研究重心高度集中于视觉感知,行业普遍聚焦于“让机器人看懂世界”。然而,在真实的精细化操作场景中,核心挑战往往并非视觉识别本身,而是物理接触后的交互环节。
例如,机器人可能能够完成USB接口的视觉对准,却难以判断插入过程中的受力变化与合适力度;能够夹起衣物,却无法实时感知布料的滑移状态与张力分布,难以完成精准的褶皱整理。绝大多数精细化操作的失败节点,都发生在物理接触发生之后的交互过程。这一行业共性痛点,为新进入者提供了差异化的切入点。
在此背景下,源自复旦大学可信具身智能研究院的新智具身(NeoteAI)选择了一条被主流忽视的赛道——触觉具身智能。2026年5月27日,新智具身宣布完成近亿元天使轮融资,由上海国投旗下上海科创集团、复旦科创联合领投,上海科创集团旗下策源基金等共同投资,多维资本担任独家财务顾问。
核心内容
新智具身的核心逻辑在于推动具身智能从单一的“视觉中心主义”向“视觉+触觉双中心”的感知体系演进。视觉负责全局定位与语义理解,而触觉则承担接触后的物理状态反馈与动态调整。公司并未选择单一硬件切入,而是同步布局视触觉传感器、精细化数据采集平台与触觉具身大模型三大核心板块,构建完整的技术闭环。
1. 硬件突破:视触觉传感器 新智具身自主研发了适配工业夹爪与灵巧手的视触觉传感器。与传统压阻式、电容式传感器仅能输出低维离散点信号不同,该传感器采用光学感知范式:内部集成微型光学相机,通过拍摄柔性硅胶表层在接触物体时产生的亚毫米级形变图像,再由端侧深度学习模型解耦出六维力信息、滑移轨迹、物体表面轮廓与像素级力场分布。 这一技术路线具备两大优势:一是感知信息密度显著提升,提供全域接触表征;二是输出数据格式与视觉数据高度兼容,可与现有Transformer架构及视觉数据自然融合,降低了触觉模态接入已有具身模型的技术门槛。该传感器由复旦可信具身智能研究院研究员陈文明及其博士生罗虎主导研发。
2. 数据规模化:触觉具身数据 Scaling up 触觉感知能力的释放依赖于大规模、高质量的触觉交互数据。针对行业触觉数据稀缺的痛点,新智具身搭建了超千平方米的专业化触觉具身数据采集中心,覆盖USB插接、螺丝拧入、线束装配、织物整理等精细化操作场景。 公司构建了互补式的采集体系:
- 真机采集线:通过标准化机械臂保证数据的精度、一致性与多模态同步性,集成自研传感器与力反馈系统。
- 全自研触觉UMI便携式采集终端:降低部署成本与周期,支持跨品牌、跨型号机械臂的数据迁移与适配。 新智具身认为,当前具身领域数据量约为千万级别,而语言模型起步于十亿甚至百亿,这种数量级差距限制了具身模型的泛化能力。因此,公司采取“先做大规模,再优化成本”的路径,目前数据优先供给内部模型训练。
3. 模型赋能:VTLA与触觉世界模型 数据的终极价值在于融入模型训练与推理链路。新智具身致力于将触觉接入预训练具身大模型,并结合强化学习技术:
- VTLA模型:相比传统VLA依赖视觉与语言输出动作,VTLA可实时获取夹持、滑移、到位、形变等接触反馈,精准指导操作。
- 触觉世界模型:补齐纯视觉在柔性材料、精密装配等任务中的物理信息短板,提高精细化操作成功率。
- 强化学习:利用触觉作为实时修正动作的信号,如阻力异常、夹持不稳或滑移时,模型可据此调整下一步动作。
4. 团队与商业化路径 新智具身核心团队源自复旦大学可信具身智能研究院,具备深厚产学研基因。CEO赵世豪(复旦本科/硕士,港大博士,前微软全球研究院、阿里通义实验室研究员)、首席科学家吴祖煊(复旦可信具身智能研究院副院长,前Meta研究员)、COO董道国(前华为荣耀Magic一代首席架构师)组成了“梦之队”。 商业化方面,公司首选工厂场景。相比家用场景,工厂任务结构清楚、效果可量化、泛化要求较低,且上海本地汽车、3C、家纺等产业聚集,为技术落地提供了土壤。目前,公司已在多个工业细分场景落地POC验证订单。
关键要点
- 赛道选择:避开竞争激烈的纯视觉路线,切入机器人精细化操作中缺失的“触觉”环节,赌的是“视觉+触觉双中心”的感知演进。
- 技术路线:采用视触觉感知范式,通过光学相机捕捉硅胶形变,解耦出高维物理信息(六维力、滑移、轮廓等),解决传统传感器信息密度低、难以迭代的问题。
- 数据策略:建立超千平方米采集中心,采用“真机采集线+UMI便携终端”互补体系,优先追求数据规模(Scaling up)以弥补具身数据与语言模型数据的数量级差距。
- 模型创新:构建VTLA模型和触觉世界模型,将触觉信息实时融入预训练大模型与强化学习回路,解决接触后的状态反馈与动态调整问题。
- 团队背景:核心团队来自复旦大学可信具身智能研究院,兼具微软、Meta、阿里、华为等顶尖科技公司的研发与架构经验。
- 商业落地:首站聚焦工业工厂场景(线束装配、内存插拔等),利用上海本地产业生态优势,目前已获得近亿元天使轮融资及多项政府专项资金支持。
意义与影响
新智具身的出现标志着具身智能行业正在从“看懂世界”向“触摸世界”深化。其意义在于:
- 补齐感知短板:证明了触觉是精细化操作中不可或缺的核心感知要素,推动了行业从单一视觉感知向多模态融合感知的转变。
- 降低技术门槛:通过视触觉传感器与视觉数据格式的兼容,降低了触觉模态接入现有Transformer架构和具身模型的技术壁垒,加速了行业标准化进程。
- 提供差异化竞争路径:对于后发企业而言,纯视觉路线已进入资源密集型竞争阶段,新智具身通过触觉这一新变量,为构建不可替代的竞争壁垒提供了新范式。
- 加速产业化落地:通过聚焦工业场景验证触觉带来的增益,不仅解决了具体行业的痛点(如线束装配、柔性材料处理),也为通用机器人进入更复杂的物理交互场景积累了关键数据与模型能力。
随着触觉从“可选模态”变为“标配”,具身智能在物理交互过程中的实时调整能力将成为下一阶段行业竞争的核心分水岭。
