英伟达发布全球首款全模态物理AI模型Cosmos 3
速览
英伟达正式推出NVIDIA Cosmos 3,这是全球首款完全开放的全模态物理AI基础模型。该模型采用全新混合Transformer架构,具备视觉推理、世界生成和动作预测三大核心能力。同时,英伟达还牵头成立了全球开发者协作联盟以推动生态建设。
AI 深度解读
背景
在人工智能从单一模态向多模态、从数字世界向物理世界延伸的关键节点,英伟达(NVIDIA)正式发布了其最新的全球首款完全开放的全模态物理AI模型——NVIDIA Cosmos 3。与此同时,具身智能赛道也传来重要动态,家庭具身智能企业“星灿智能”(XCANBOT)完成了千万级天使+轮战略融资,并获得了包括力合科创、山东亚华电子、浙江亚特在内的三大上市产业资本的投资。这两大事件分别代表了底层基础模型能力的突破与垂直领域应用落地的加速,共同勾勒出物理AI发展的最新图景。
核心内容
英伟达此次官宣的 NVIDIA Cosmos 3 是一款面向物理AI的开放世界基础模型。该模型采用了全新的混合Transformer架构,旨在打通视觉推理、世界生成、动作预测三大核心能力。凭借这一技术架构,NVIDIA Cosmos 3 成为全球首款完全开放的全模态物理AI模型。此外,英伟达还牵头成立了全球开发者协作联盟,以推动生态建设。
在应用层面,家庭具身智能企业“星灿智能”(XCANBOT)近日完成了千万级天使+轮战略融资,投资方为A股科创平台力合科创。至此,星灿智能已获山东亚华电子、浙江亚特、力合科创三大上市产业资本投资。该公司团队核心成员来自头部自动驾驶企业,其核心产品包括自研的 XcanBrain 具身大模型与5D全域空间感知系统。
星灿智能的产品逻辑区别于传统机器人远程遥控、单视角采集存在盲区以及数据固化滞后的短板。公司依托实景无盲区数据闭环,实现了模型的持续自进化。目前,其双赛道产品已完成市场验证,在手订单突破亿元,即将进入规模化量产阶段。
关键要点
- NVIDIA Cosmos 3 的技术突破:采用混合Transformer架构,具备视觉推理、世界生成、动作预测三大核心能力,是全球首款完全开放的全模态物理AI模型。
- 生态协作启动:英伟达牵头成立全球开发者协作联盟,旨在构建更广泛的开发者生态。
- 星灿智能融资进展:完成千万级天使+轮战略融资,由力合科创投资,累计获得三大上市产业资本支持。
- 核心技术差异化:星灿智能通过自研 XcanBrain 具身大模型与5D全域空间感知系统,解决传统机器人单视角盲区和数据滞后问题,实现实景无盲区数据闭环和模型自进化。
- 商业化落地加速:星灿智能双赛道产品已完成市场验证,在手订单破亿元,即将实现规模化量产。
意义与影响
NVIDIA Cosmos 3 的发布标志着物理AI基础模型进入完全开放的新阶段。通过打通视觉、生成与动作预测,该模型为机器人和其他物理AI系统提供了更强大的底层能力支持,而混合Transformer架构的应用则可能进一步提升处理复杂物理场景的效率。英伟达牵头成立开发者联盟,将进一步加速这一技术栈在行业内的普及与应用创新。
与此同时,星灿智能的融资与量产计划反映了具身智能从技术验证向商业化落地加速转变的趋势。其依托自动驾驶团队背景及数据闭环技术,试图解决具身智能领域长期存在的数据获取与模型迭代难题。在手订单破亿元及即将规模化量产的消息,表明家庭服务机器人等垂直场景已具备初步的商业可行性,有望带动相关产业链的发展。
