FllumaOne:含可执行代码与内核验证的CAD多模态数据集
速览
研究团队推出FllumaOne,这是一个代码原生的多模态CAD数据集,包含10万条通过内核几何、实体有效性和导出检查验证的样本。每个样本对齐了可执行Python程序、结构化特征树、STEP几何及自然语言描述等。基于Qwen2.5-Coder-1.5B的基线实验显示,该数据集在CAD重建、程序合成及逆向工程方面具有显著价值。
AI 深度解读
FllumaOne:首个代码原生的多模态 CAD 数据集,具备可执行程序与内核验证特征历史
背景
参数化计算机辅助设计(CAD)的核心价值不仅在于记录最终的几何形状,更在于记录决定零件如何被编辑的有序构建历史。传统的 CAD 数据集往往只关注静态几何或简化的拓扑结构,缺乏对建模操作、参数以及特征依赖关系的完整暴露。这限制了可编辑 CAD 研究的发展,因为研究人员需要能够同时访问验证过的几何体、建模逻辑及其依赖关系的数据集,以训练模型理解设计意图并支持后续的编辑操作。
为了解决这一痛点,研究者引入了 FllumaOne,这是一个代码原生的多模态 CAD 数据集。该数据集的模型由在 Flluma(一个基于 Qt/C++ 和 OpenCASCADE 的 CAD 系统)中运行的可执行 Python 程序生成。这种“代码原生”的方法确保了每个设计都拥有明确的逻辑路径和可追溯的构建过程。
核心内容
FllumaOne 的核心创新在于其多模态对齐机制。每个样本都严格对齐以下多种数据形式:
- 可执行 Python 程序:在 Flluma 系统中生成模型的代码。
- 结构化特征树:一种面向训练的中间表示形式,清晰展示特征的层级和依赖。
- STEP 几何文件:标准的工业交换格式几何数据。
- 表面点云:用于几何近似和比较的离散点数据。
- 自然语言描述:对设计意图的文本解释。
- 元数据:关于模型的各种属性信息。
- 八种规范可见边缘渲染图:从不同视角展示的线框或边缘渲染图像。
数据集规模与质量控制
首批发布的数据集 FllumaOne-100K 包含 100,000 个经过严格筛选的样本,涵盖了四种模板级别的复杂度区间。其质量控制流程极为严谨:
- 内核验证:程序必须通过几何内核验证,确保实体有效性(solid validity)。
- 导出检查:必须成功导出为 STEP 格式。
- 完整性报告:发布报告记录了模态完整性和分割级别的重复测试情况,确保数据的高信噪比。
基线模型性能
为了验证数据集的有效性,研究团队在 80,000 个样本上训练了一个基于 Qwen2.5-Coder-1.5B 的 LoRA 基线模型,并在保留的 10,000 个样本测试集上进行了评估。结果如下:
- Python 语法有效性:达到 99.98%。
- Flluma 构建成功率:达到 99.97%。
- STEP 导出有效性:达到 99.14%。
- 几何精度:在将 9,909 个预测结果转换为表面点云后,平均归一化 Chamfer 距离(Mean Normalized Chamfer Distance)仅为 0.002124,显示出极高的几何重建精度。
关键要点
- 代码原生架构:不同于传统的几何数据格式,FllumaOne 以可执行的 Python 代码为核心,直接暴露建模逻辑,使得 AI 模型能够学习“如何设计”而非仅仅“设计长什么样”。
- 多模态严格对齐:每个样本都包含代码、特征树、几何文件(STEP)、点云、文本描述和渲染图,实现了从逻辑到视觉的全方位对齐,支持复杂的跨模态学习任务。
- 工业级数据清洗:通过内核几何验证、实体有效性检查和导出测试,确保了数据集的工业可用性和鲁棒性,过滤掉了大量无效或错误的生成样本。
- 极高的生成保真度:基线模型在语法、构建和导出三个关键指标上均超过 99% 的成功率,且几何重建误差极低,证明了数据集对于训练高精度 CAD 生成模型的有效性。
- 广泛的应用场景:该数据集支持条件化 CAD 重建、可执行程序合成、特征树预测、B-Rep(边界表示)分析、检索、设计补全以及可编辑的反向工程。
意义与影响
FllumaOne 的发布标志着 AI 辅助设计领域的一个重要里程碑。它解决了长期困扰该领域的“黑盒”问题——即 AI 生成的几何体缺乏可编辑性和逻辑解释性。通过提供带有完整特征历史和代码逻辑的数据集,FllumaOne 使得训练能够理解设计意图并生成可编辑模型的 AI 成为可能。
对于工业界而言,这意味着更智能的设计辅助工具,能够根据自然语言描述或草图生成可进一步修改的参数化模型,从而大幅缩短产品开发周期。对于学术界,FllumaOne 提供了一个标准化的基准,推动了可编辑 CAD 生成、逆向工程和特征预测等研究方向的发展。其严格的验证流程也为其他领域构建高质量、可执行的多模态数据集树立了新的标杆。
