融资数亿元,前华为AI所长刘武龙聊具身系统创新
速览
前华为加拿大AI研究所所长刘武龙创立贝塔无限,近日宣布完成种子+轮融资,累计获投数亿元。刘武龙拥有十余年华为AI系统工程经验,主张以系统工程思维解决具身智能在感知、决策、控制及商业化闭环中的难题。他批评当前行业路线分化严重,提出“具身大脑”应包含理解记忆、小脑控制及世界模型等组件,而非单一模型。
AI 深度解读
背景
具身智能(Embodied AI)赛道正处于技术路线分化与商业化落地的关键十字路口。传统机器人派在机械控制上虽具优势,但在通用泛化能力上存在瓶颈;而近期大量拥有自动驾驶背景的团队入场,试图将路径规划与定位精度等优势迁移至具身领域,却往往因交互僵硬、缺乏“消费者视角”而陷入困境。与此同时,VLA(Vision-Language-Action)模型的黑盒困境、世界模型的虚实隔阂以及数据飞轮的规模焦虑,使得行业在技术收敛上仍面临巨大挑战。
在此背景下,前华为加拿大 AI 研究所所长刘武龙创立的贝塔无限(Beta Infinity)宣布完成种子+轮融资,由世纪华通与和利资本联合领投,毅达资本、南山战新投等知名机构跟投。短短两月累计融资数亿元,显示出资本市场对其团队背景及技术路线的认可。刘武龙拥有十余年华为 AI 系统工程的全栈经验,横跨自动驾驶量产、大模型工程化及硬件交付,其提出的“具身大脑”架构及“类家庭可控场景众包”数据策略,为具身智能的落地提供了新的系统性思路。
核心内容
1. 团队基因与创业动机:从“降维打击”到“升维融合” 刘武龙指出,具身智能并非简单的算法堆叠,而是感知、决策、控制、记忆、个性化、数据回流、硬件适配及商业化的完整闭环。他批评单纯将自动驾驶技术迁移至具身领域的“降维派”观点,认为两者场景维度完全不同:自动驾驶是高安全约束、封闭道路、弱交互;而具身智能面对的是开放家庭环境、高自由度柔性操作、强人机交互及长时记忆需求。贝塔无限的团队由大模型、自动驾驶、个性化 AI 系统及 VLA 模型专家组成,旨在弥合不同技术背景团队的思维冲突,通过“自驾经验+大模型”的升维融合来解决消费级具身智能的落地难题。
2. 技术架构:四维一体的“具身大脑” 刘武龙重新定义了“具身大脑”,将其视为一套能在物理世界闭环生存的操作系统,而非单一的大模型。其核心架构包括:
- 大脑:负责理解、长程规划、个性化及记忆。
- 小脑:负责毫秒级控制、抓取、平衡及避障。
- 世界模型:用于推演与优化。
- 全时空多模态记忆系统。
在路线选择上,贝塔无限目前采用“统一基座 + 大小脑分层”的两段式逻辑,而非纯粹的 VLA 端到端方案。原因在于纯端到端模型在家庭场景下存在可解释性差、安全性低及数据效率低的问题。贝塔无限的核心差异在于“联合训练”:在同一个基座模型中,大小脑进行联合训练,网络结构和执行频率内部分层,但训练推理是端到端的。这使得机器人既能处理复杂的语义交互,又能实现毫秒级的物理控制,并支持实时打断与重规划。此外,他们强调世界模型需结合强化学习用于动作序列推演,以提升样本效率,而非仅用于视频预测。
3. 数据策略:拒绝“偷拍”与“封闭工厂”,推行众包模式 针对行业普遍陷入的“离线预训练内卷”,刘武龙提出具身智能的终局在于最后 20% 的长尾场景与个性化数据。贝塔无限坚决反对进入家庭偷拍或建立封闭数据工厂,而是采用“类家庭可控场景众包”模式:利用高端民宿、酒店式公寓及中介空置房等与家庭环境相似且存在租客真空期的场景,通过轻量化穿戴设备采集数据。配合自研的低成本采集设备,目标在低成本下获取 30-50 万小时的高质量家庭操作数据。同时,他们现阶段不使用纯虚拟仿真数据,以规避 Sim-to-Real Gap 及高昂的仿真器构建成本。
4. 产品路径:从“情绪伙伴”到“物理 Agent” 在产品切入点上,贝塔无限排除了纯人形双足机器人(成本高、落地难)和纯机器狗(缺乏操作能力),选择打造一款“类人”的家庭成员。首款产品定位为“养成系”伙伴,强调安全性、接受度、移动性及操作能力的结合,并通过工业设计提供情绪价值。 冷启动策略分为四步:
- 让用户接受机器人作为“高阶伙伴”存在。
- 从递拖鞋、开门、收垃圾等高频轻操作入手,做到极致。
- 整合家中现有智能设备(洗衣机、冰箱等),成为“总指挥”。
- 串联能力,执行洗衣、拖地等长程任务,进化为真正的物理 Agent。
5. 商业化终局:先活下来,再定义规则 刘武龙认为,单一技术背景的团队难以跑通具身智能。贝塔无限的商业化路径分为三阶段:短期通过小机器人跑通 C 端冷启动,形成数据飞轮;中期通过“一脑多体”方案对外授权,赋能行业;长期成为家庭物理 Agent 的操作系统级公司,定义行业标准。
关键要点
- 技术路线分歧:传统机器人派泛化难,智驾派交互僵,大模型派缺乏硬件落地能力。贝塔无限主张融合三者优势,采用“统一基座 + 大小脑分层”架构,解决 VLA 端到端模型在安全性、可解释性及数据效率上的不足。
- 大小脑联合训练:区别于市面上“两层皮”的大小脑拼接,贝塔无限在同一个基座模型中实现大小脑的联合训练与端到端推理,支持实时打断与边聊边干,适配消费级场景。
- 数据飞轮真相:行业痛点在于从 80% 泛化到 99% 场景自适应的跨越。贝塔无限采用“类家庭可控场景众包”模式,利用民宿/空置房采集数据,规避隐私风险与高昂成本,目标获取 30-50 万小时高质量数据。
- 产品定位:不做炫技的工具,也不做短期内无法落地的纯人形机器人。首款产品定位为具有情绪价值的“养成系”家庭伙伴,通过“递拖鞋、开门”等轻操作建立信任,逐步进化为控制全屋设备的物理 Agent。
- 商业逻辑:拒绝技术自嗨,强调 ROI。短期靠 C 端产品积累数据,中期靠技术授权变现,长期做操作系统级平台。
意义与影响
刘武龙及贝塔无限的实践,为具身智能行业提供了一个从“实验室 Demo”走向“家庭落地”的系统工程范本。其核心价值在于打破了当前行业对单一模型能力或单一技术背景(如纯智驾或纯大模型)的迷信,强调了系统工程思维在具身智能中的决定性作用。
首先,在技术层面,其提出的“联合训练的大小脑架构”和“结合强化学习的世界模型”,为解决 VLA 模型在真实物理世界中的稳定性与安全性问题提供了可行的工程路径,有助于推动行业从概念验证向稳定商用过渡。
其次,在数据层面,其“类家庭可控场景众包”模式探索了一条低成本、规模化获取高质量家庭操作数据的新路径,有望缓解行业普遍面临的数据稀缺与隐私合规难题,加速数据飞轮的运转。
最后,在产品与商业层面,贝塔无限坚持“消费者视角”和“情绪价值”,将机器人定义为“家庭成员”而非冷冰冰的工具,这一理念有助于降低 C 端用户的接受门槛,推动具身智能从极客玩具走向大众消费市场。其“先活下来,再长大,最后定义规则”的商业节奏,也为其他初创团队在资本寒冬与技术长跑中提供了务实的参考。
