技术博客arXiv cs.AI·2 小时前

FllumaOne：含可执行代码与内核验证的CAD多模态数据集

原标题：FllumaOne: A Code-Native Multimodal CAD Dataset with Executable Programs and Kernel-Validated Feature Histories

速览

研究团队推出FllumaOne，这是一个代码原生的多模态CAD数据集，包含10万条通过内核几何、实体有效性和导出检查验证的样本。每个样本对齐了可执行Python程序、结构化特征树、STEP几何及自然语言描述等。基于Qwen2.5-Coder-1.5B的基线实验显示，该数据集在CAD重建、程序合成及逆向工程方面具有显著价值。

AI 深度解读

FllumaOne：首个代码原生的多模态 CAD 数据集，具备可执行程序与内核验证特征历史

背景

参数化计算机辅助设计（CAD）的核心价值不仅在于记录最终的几何形状，更在于记录决定零件如何被编辑的有序构建历史。传统的 CAD 数据集往往只关注静态几何或简化的拓扑结构，缺乏对建模操作、参数以及特征依赖关系的完整暴露。这限制了可编辑 CAD 研究的发展，因为研究人员需要能够同时访问验证过的几何体、建模逻辑及其依赖关系的数据集，以训练模型理解设计意图并支持后续的编辑操作。

为了解决这一痛点，研究者引入了 FllumaOne，这是一个代码原生的多模态 CAD 数据集。该数据集的模型由在 Flluma（一个基于 Qt/C++ 和 OpenCASCADE 的 CAD 系统）中运行的可执行 Python 程序生成。这种“代码原生”的方法确保了每个设计都拥有明确的逻辑路径和可追溯的构建过程。

核心内容

FllumaOne 的核心创新在于其多模态对齐机制。每个样本都严格对齐以下多种数据形式：

可执行 Python 程序：在 Flluma 系统中生成模型的代码。
结构化特征树：一种面向训练的中间表示形式，清晰展示特征的层级和依赖。
STEP 几何文件：标准的工业交换格式几何数据。
表面点云：用于几何近似和比较的离散点数据。
自然语言描述：对设计意图的文本解释。
元数据：关于模型的各种属性信息。
八种规范可见边缘渲染图：从不同视角展示的线框或边缘渲染图像。

数据集规模与质量控制

首批发布的数据集 FllumaOne-100K 包含 100,000 个经过严格筛选的样本，涵盖了四种模板级别的复杂度区间。其质量控制流程极为严谨：

内核验证：程序必须通过几何内核验证，确保实体有效性（solid validity）。
导出检查：必须成功导出为 STEP 格式。
完整性报告：发布报告记录了模态完整性和分割级别的重复测试情况，确保数据的高信噪比。

基线模型性能

为了验证数据集的有效性，研究团队在 80,000 个样本上训练了一个基于 Qwen2.5-Coder-1.5B 的 LoRA 基线模型，并在保留的 10,000 个样本测试集上进行了评估。结果如下：

Python 语法有效性：达到 99.98%。
Flluma 构建成功率：达到 99.97%。
STEP 导出有效性：达到 99.14%。
几何精度：在将 9,909 个预测结果转换为表面点云后，平均归一化 Chamfer 距离（Mean Normalized Chamfer Distance）仅为 0.002124，显示出极高的几何重建精度。

关键要点

代码原生架构：不同于传统的几何数据格式，FllumaOne 以可执行的 Python 代码为核心，直接暴露建模逻辑，使得 AI 模型能够学习“如何设计”而非仅仅“设计长什么样”。
多模态严格对齐：每个样本都包含代码、特征树、几何文件（STEP）、点云、文本描述和渲染图，实现了从逻辑到视觉的全方位对齐，支持复杂的跨模态学习任务。
工业级数据清洗：通过内核几何验证、实体有效性检查和导出测试，确保了数据集的工业可用性和鲁棒性，过滤掉了大量无效或错误的生成样本。
极高的生成保真度：基线模型在语法、构建和导出三个关键指标上均超过 99% 的成功率，且几何重建误差极低，证明了数据集对于训练高精度 CAD 生成模型的有效性。
广泛的应用场景：该数据集支持条件化 CAD 重建、可执行程序合成、特征树预测、B-Rep（边界表示）分析、检索、设计补全以及可编辑的反向工程。

意义与影响

FllumaOne 的发布标志着 AI 辅助设计领域的一个重要里程碑。它解决了长期困扰该领域的“黑盒”问题——即 AI 生成的几何体缺乏可编辑性和逻辑解释性。通过提供带有完整特征历史和代码逻辑的数据集，FllumaOne 使得训练能够理解设计意图并生成可编辑模型的 AI 成为可能。

对于工业界而言，这意味着更智能的设计辅助工具，能够根据自然语言描述或草图生成可进一步修改的参数化模型，从而大幅缩短产品开发周期。对于学术界，FllumaOne 提供了一个标准化的基准，推动了可编辑 CAD 生成、逆向工程和特征预测等研究方向的发展。其严格的验证流程也为其他领域构建高质量、可执行的多模态数据集树立了新的标杆。

查看原文 →arxiv.org