AI 资讯量子位·3 天前

材料版AlphaFold问世，叠加LLM实现40项工业任务SOTA

原标题：材料版AlphaFold来了！40个工业任务全方位SOTA，AI4S迎来行业大突破

速览

材料科学领域迎来重大突破，被称为“材料版AlphaFold”的AI模型正式问世。该模型通过叠加大语言模型（LLM）的训练优势，成功习得了“物理直觉”，显著提升了预测精度。在40项工业任务中，该模型均达到了当前最优水平（SOTA），标志着AI for Science（AI4S）行业取得实质性进展。

AI 深度解读

背景

在材料科学领域，AI for Science (AI4S) 长期面临一个核心痛点：理论计算与真实实验之间存在巨大的“鸿沟”。

目前，大多数材料 AI 模型（如基于 Matbench Discovery 或 Open Catalyst Project 的模型）主要依赖理论计算生成的完美数据进行训练。这种“纯计算”路线虽然在学术榜单上表现优异，但一旦进入实验室面对真实数据时，往往因为数据噪声、误差以及特定工业需求的复杂性而失效。真实实验数据不仅稀缺，而且其分布与理论数据存在显著差异，导致模型在工业场景下的泛化能力极差。

尽管数据稀缺是客观原因，但更深层的问题在于训练思路的局限。传统的材料基座模型通常仅采用“预训练 + 直接微调”的两阶段模式，缺乏对真实物理规律的深层对齐。这导致模型虽然能识别分子结构（如苯环的原子排列），却缺乏对分子性质背后物理逻辑的“直觉”（如生成焓、偶极矩等隐含规律），从而难以应对需要外推能力的陌生结构预测任务。

核心内容

来自深度原理（Deep Principle）团队发布的最新材料基座模型 MPA (Materials Property Axiom)，通过借鉴大语言模型（LLM）的训练范式，成功解决了上述问题。MPA 在 40 个真实工业任务数据集上实现了全面 SOTA（State of the Art），其核心突破在于训练架构的创新。

1. 架构设计：Transformer 的“头”与“躯干” MPA 基于 Transformer 架构，结构清晰分为两部分：

躯干：通用的图 Transformer，负责存储核心的通用材料知识。
头：根据训练阶段动态调整，以适配不同任务。

2. 训练范式：引入 LLM 式的三段式训练 MPA 摒弃了传统的两阶段训练，引入了 Mid-training（中期训练），形成了“预训练 -> 中期训练 -> 后训练微调”的完整链路：

预训练：基于通用知识库建立基础通识。
中期训练（Mid-training）：这是 MPA 的关键创新。通过“物理对齐”（physics-guided alignment），利用大规模、无噪声的第一性原理计算数据，弥补从理论计算到实验数据预测之间的鸿沟。这一阶段旨在赋予模型对真实材料需求的“物理直觉”，使其理解分子结构背后的物理规律，而不仅仅是记忆结构特征。
后训练微调：针对具体工业任务进行精细化优化。

3. 技术创新：Hybrid Readout（混合读出头） 在针对实验预测任务的后训练阶段，MPA 设计了一种创新的 Hybrid Readout 机制，将分子性质分为两类并采用不同的处理路径：

自由路径（注意力池化）：不预设规则，让模型通过注意力机制全局审视分子。适用于沸点、生物活性等与分子大小无关、体现整体“气质”的性质。
约束路径（原子加和）：将物理规律硬编码进结构，即分子性质等于各原子贡献之和。适用于生成焓、燃烧焓、热容等具有累加特性的性质。

模型通过一个可训练参数 $\alpha$ 动态平衡这两条路径：$\alpha$ 越小，越依赖自由路径；$\alpha$ 越大，越依赖约束路径。这种设计让模型能根据具体性质自动选择最合适的推理逻辑。

4. 效果验证

消融实验：与未加入中期训练和混合头的基线模型相比，MPA 在 40 个真实实验性质中，38 个性质误差降低。在更具挑战性的“骨架划分”（测试集包含训练时未见过的全新结构）下，平均误差降低 14.6%，证明模型学到了可迁移的“物理直觉”而非死记硬背。
基准对比：在与 ChemBERTa、ChemProp、Chemeleon、Uni-Mol2、Suiren 等 5 个主流模型对比中，MPA 在随机划分和骨架划分下综合表现最强，尤其在骨架划分这一“分布漂移”的硬场景下，斩获 40 个实验物性中的 35 个 SOTA。

关键要点

范式转移：MPA 将材料基础模型的适配问题重新定义为“物理对齐问题”，通过引入 LLM 的三段式训练（特别是 Mid-training），成功弥合了理论计算与真实实验之间的鸿沟。
物理直觉的建立：通过中期训练使用第一性原理数据，MPA 学会了分子结构背后的物理规律（如基团对偶极矩的影响），而非仅停留在原子位置的几何记忆上。
混合读头机制：Hybrid Readout 创新性地结合了“全局注意力”与“原子加和约束”，通过参数 $\alpha$ 动态适配不同性质的预测逻辑，显著提升了预测精度。
工业级泛化能力：在“骨架划分”测试中表现尤为突出，证明 MPA 具备强大的外推能力，能够准确预测训练集中从未出现过的全新材料结构，这正是工业研发中最核心的需求。
数据复用性：MPA 提供了一种可扩展框架，将第一性原理计算、高质量实验数据和微调训练整合，使数据不再是消耗品，而是沉淀为可复用的预测能力，避免了为单一任务训练割裂小模型的弊端。

意义与影响

MPA 的发布标志着 AI4S 领域的一个重要里程碑。它证明了源自自然语言处理的训练策略（如多阶段训练、对齐技术）同样适用于物理世界，且能带来实质性的性能突破。

1. 推动 AI4S 从“刷榜”走向“实战” MPA 在真实工业任务上的 SOTA 表现，特别是其在陌生结构预测上的优势，解决了 AI 模型“实验室里好用，工厂里没用”的行业顽疾。它展示了 AI 如何真正理解物理规律，从而在材料发现、药物研发等需要高泛化能力的场景中发挥实际价值。

2. 确立“物理对齐”的新标准 MPA 的技术路线为后续材料 AI 模型提供了新的参考标准：即不仅要追求数据拟合能力，更要通过中期训练等手段实现模型与底层物理规律的深度对齐。这种思路有望扩展到化学、生物等其他科学领域。

3. 加速材料研发闭环 作为深度原理 Agent 产品的一部分，MPA 已经接入实际工作流。其具备的强泛化能力和数据沉淀机制，使得研发人员可以利用不断积累的计算和实验数据，持续优化模型，形成“数据积累-模型增强-预测加速”的正向循环，大幅缩短新材料、新药物的研发周期。

4. 验证了通用 AI 方法论的跨界潜力 MPA 的成功进一步验证了大模型训练范式（如 Mid-training、Alignment）的通用性。它表明，通过模仿人类学习物理世界的方式（先建立基础认知，再对齐物理规律，最后微调应用），AI 可以更高效地掌握复杂科学领域的知识，为科学智能的发展开辟了务实且高效的技术路径。

查看原文 →qbitai.com

材料版AlphaFold问世，叠加LLM实现40项工业任务SOTA

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐