← 返回信息流
AI 资讯量子位·3 天前

材料版AlphaFold问世,叠加LLM实现40项工业任务SOTA

原标题:材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

速览

材料科学领域迎来重大突破,被称为“材料版AlphaFold”的AI模型正式问世。该模型通过叠加大语言模型(LLM)的训练优势,成功习得了“物理直觉”,显著提升了预测精度。在40项工业任务中,该模型均达到了当前最优水平(SOTA),标志着AI for Science(AI4S)行业取得实质性进展。

AI 深度解读

背景

在材料科学领域,AI for Science (AI4S) 长期面临一个核心痛点:理论计算与真实实验之间存在巨大的“鸿沟”。

目前,大多数材料 AI 模型(如基于 Matbench Discovery 或 Open Catalyst Project 的模型)主要依赖理论计算生成的完美数据进行训练。这种“纯计算”路线虽然在学术榜单上表现优异,但一旦进入实验室面对真实数据时,往往因为数据噪声、误差以及特定工业需求的复杂性而失效。真实实验数据不仅稀缺,而且其分布与理论数据存在显著差异,导致模型在工业场景下的泛化能力极差。

尽管数据稀缺是客观原因,但更深层的问题在于训练思路的局限。传统的材料基座模型通常仅采用“预训练 + 直接微调”的两阶段模式,缺乏对真实物理规律的深层对齐。这导致模型虽然能识别分子结构(如苯环的原子排列),却缺乏对分子性质背后物理逻辑的“直觉”(如生成焓、偶极矩等隐含规律),从而难以应对需要外推能力的陌生结构预测任务。

核心内容

来自深度原理(Deep Principle)团队发布的最新材料基座模型 MPA (Materials Property Axiom),通过借鉴大语言模型(LLM)的训练范式,成功解决了上述问题。MPA 在 40 个真实工业任务数据集上实现了全面 SOTA(State of the Art),其核心突破在于训练架构的创新。

1. 架构设计:Transformer 的“头”与“躯干” MPA 基于 Transformer 架构,结构清晰分为两部分:

  • 躯干:通用的图 Transformer,负责存储核心的通用材料知识。
  • :根据训练阶段动态调整,以适配不同任务。

2. 训练范式:引入 LLM 式的三段式训练 MPA 摒弃了传统的两阶段训练,引入了 Mid-training(中期训练),形成了“预训练 -> 中期训练 -> 后训练微调”的完整链路:

  • 预训练:基于通用知识库建立基础通识。
  • 中期训练(Mid-training):这是 MPA 的关键创新。通过“物理对齐”(physics-guided alignment),利用大规模、无噪声的第一性原理计算数据,弥补从理论计算到实验数据预测之间的鸿沟。这一阶段旨在赋予模型对真实材料需求的“物理直觉”,使其理解分子结构背后的物理规律,而不仅仅是记忆结构特征。
  • 后训练微调:针对具体工业任务进行精细化优化。

3. 技术创新:Hybrid Readout(混合读出头) 在针对实验预测任务的后训练阶段,MPA 设计了一种创新的 Hybrid Readout 机制,将分子性质分为两类并采用不同的处理路径:

  • 自由路径(注意力池化):不预设规则,让模型通过注意力机制全局审视分子。适用于沸点、生物活性等与分子大小无关、体现整体“气质”的性质。
  • 约束路径(原子加和):将物理规律硬编码进结构,即分子性质等于各原子贡献之和。适用于生成焓、燃烧焓、热容等具有累加特性的性质。

模型通过一个可训练参数 $\alpha$ 动态平衡这两条路径:$\alpha$ 越小,越依赖自由路径;$\alpha$ 越大,越依赖约束路径。这种设计让模型能根据具体性质自动选择最合适的推理逻辑。

4. 效果验证

  • 消融实验:与未加入中期训练和混合头的基线模型相比,MPA 在 40 个真实实验性质中,38 个性质误差降低。在更具挑战性的“骨架划分”(测试集包含训练时未见过的全新结构)下,平均误差降低 14.6%,证明模型学到了可迁移的“物理直觉”而非死记硬背。
  • 基准对比:在与 ChemBERTa、ChemProp、Chemeleon、Uni-Mol2、Suiren 等 5 个主流模型对比中,MPA 在随机划分和骨架划分下综合表现最强,尤其在骨架划分这一“分布漂移”的硬场景下,斩获 40 个实验物性中的 35 个 SOTA。

关键要点

  • 范式转移:MPA 将材料基础模型的适配问题重新定义为“物理对齐问题”,通过引入 LLM 的三段式训练(特别是 Mid-training),成功弥合了理论计算与真实实验之间的鸿沟。
  • 物理直觉的建立:通过中期训练使用第一性原理数据,MPA 学会了分子结构背后的物理规律(如基团对偶极矩的影响),而非仅停留在原子位置的几何记忆上。
  • 混合读头机制:Hybrid Readout 创新性地结合了“全局注意力”与“原子加和约束”,通过参数 $\alpha$ 动态适配不同性质的预测逻辑,显著提升了预测精度。
  • 工业级泛化能力:在“骨架划分”测试中表现尤为突出,证明 MPA 具备强大的外推能力,能够准确预测训练集中从未出现过的全新材料结构,这正是工业研发中最核心的需求。
  • 数据复用性:MPA 提供了一种可扩展框架,将第一性原理计算、高质量实验数据和微调训练整合,使数据不再是消耗品,而是沉淀为可复用的预测能力,避免了为单一任务训练割裂小模型的弊端。

意义与影响

MPA 的发布标志着 AI4S 领域的一个重要里程碑。它证明了源自自然语言处理的训练策略(如多阶段训练、对齐技术)同样适用于物理世界,且能带来实质性的性能突破。

1. 推动 AI4S 从“刷榜”走向“实战” MPA 在真实工业任务上的 SOTA 表现,特别是其在陌生结构预测上的优势,解决了 AI 模型“实验室里好用,工厂里没用”的行业顽疾。它展示了 AI 如何真正理解物理规律,从而在材料发现、药物研发等需要高泛化能力的场景中发挥实际价值。

2. 确立“物理对齐”的新标准 MPA 的技术路线为后续材料 AI 模型提供了新的参考标准:即不仅要追求数据拟合能力,更要通过中期训练等手段实现模型与底层物理规律的深度对齐。这种思路有望扩展到化学、生物等其他科学领域。

3. 加速材料研发闭环 作为深度原理 Agent 产品的一部分,MPA 已经接入实际工作流。其具备的强泛化能力和数据沉淀机制,使得研发人员可以利用不断积累的计算和实验数据,持续优化模型,形成“数据积累-模型增强-预测加速”的正向循环,大幅缩短新材料、新药物的研发周期。

4. 验证了通用 AI 方法论的跨界潜力 MPA 的成功进一步验证了大模型训练范式(如 Mid-training、Alignment)的通用性。它表明,通过模仿人类学习物理世界的方式(先建立基础认知,再对齐物理规律,最后微调应用),AI 可以更高效地掌握复杂科学领域的知识,为科学智能的发展开辟了务实且高效的技术路径。

查看原文 →qbitai.com