← 返回信息流
技术博客arXiv cs.AI·3 小时前

Brick-Composer利用多模态大模型实现积木组装

原标题:Brick-Composer: Using MLLMs for Assembly with Diverse Bricks

速览

研究团队提出Brick-Composer框架,旨在利用多模态大语言模型(MLLMs)解决从积木块组装真实物体的难题。该框架通过人类设计演示、世界反馈和合成经验三种信号,显著提升了模型的积木选择精度和姿态估计准确性。实验表明,经过训练后,Qwen-3-8B模型在完整对象组装步骤中的正确率可达42%,证明了MLLMs可通过针对性学习获得组装能力。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org