← 返回信息流
AI 资讯Hacker News·2 小时前

AI化学家优化药物化学中极具挑战性的反应

原标题:AI chemist improves a challenging reaction in medicinal chemistry

速览

研究人员利用人工智能技术,成功优化了药物化学中一项极具挑战性的化学反应。这一突破展示了AI在复杂化学合成路径设计中的强大能力,有望显著加速新药研发进程。该成果为利用机器学习解决传统化学难题提供了重要范例。

AI 深度解读

AI 化学家优化药物化学中的挑战性反应

背景

OpenAI 在科学领域的探索源于一个核心理念:先进的 AI 可以成为科学家的强大合作伙伴,帮助他们探索更多想法、连接遥远概念、设计更优实验,并加速造福人类的发现。此前,OpenAI 已展示了模型在数学(如单位距离问题)、理论物理(如胶子振幅新结果)以及生物学(通过自动化实验室降低无细胞蛋白质合成成本)等领域贡献新颖成果的早期案例。此外,OpenAI 还推出了专为支持生命科学研究和药物发现工作流而设计的 GPT-Rosalind 模型。

然而,药物化学领域的进步不能仅靠推理来衡量。假设必须在实验室中通过真实的分子、仪器和实验噪声来验证。为了将这一轨迹延伸至药物化学,OpenAI 与 Molecule.one 合作,将 GPT-5.4 连接到 Maria——一个集成高通量实验室、用于自主研究的代理化学 AI 系统。该系统被赋予了一个开放式目标:改进几种重要的反应类别之一。在这个“近自主”的工作流中,人类科学家负责设计引导和评分提示、选择提案进行测试、对实验计划进行有限修正、协助基本实验室操作,并独立验证最终结果。

核心内容

本次合作的核心成果是 GPT-5.4 在优化“Chan-Lam 偶联反应”(一种用于形成碳-氮键的重要药物化学反应)方面取得了突破性进展。

1. 挑战与发现 Chan-Lam 偶联反应在药物化学中很有用,因为它能形成药物中常见的碳-氮键。然而,该反应并非对所有分子类别都同样有效。特别是,伯磺酰胺(primary sulfonamides)与硼酸(boronic acids)的偶联反应历史上产率较低。磺酰胺基团广泛存在于抗癌药、抗菌药和利尿剂等多种治疗领域的药物中。

GPT-5.4 独立识别出伯磺酰胺是一个具有挑战性但高价值的底物类别,并大胆提出使用温和氧化剂(包括 TEMPO)可能提高反应效率。这一建议被标记为提案 OAI-M1-03。

2. 实验执行与规模 整个流程耗时三个月(从3月4日的首次提示到6月4日分享结果)。Maria 实验室执行了总计 10,080 次反应。这一规模至关重要,因为仅测试少量样本可能会产生误导性结果。相比之下,一名化学家每天进行三次反应,十年也仅做一万多次。如此大规模的数据使得系统能够从十种测试氧化剂中识别出 TEMPO,并观察到其在不同组合中的重复效应及其局限性。

3. 结果优化 在 Maria 实验室的两个实验周期后,优化条件下的反应效果显著提升:

  • 产率提升: 测试过的 88% 的硼酸和 83% 的磺酰胺的测量产率有所提高。
  • 平均产率: 从 16.6% 上升至 25.2%。
  • 高产率比例: 产率超过 30% 的反应比例从 15.6% 增加到 37.5%。

4. 人类验证与修正 虽然 AI 提出了关键想法,但人类科学家在过程中提供了高级指导和判断。例如,在生成实验网格时,人类对实验计划进行了有限修正,主要是避免使用二甲基亚砜(DMSO)作为溶剂,因为化学家担心它会与作为对照使用的更强氧化剂发生反应。

随后,人类化学家在工作台规模(bench scale)上手动重复了代表性反应,以验证微升规模筛选实验的结果。结果显示,在 14 对底物中,有 11 对的产率更高,大多数情况下产率增加了一倍以上。这证明了该反应不仅在微升筛选中有效,在实际的药物发现工作流中也具有实用性。

5. 进一步发现 在分析第一轮数据后,系统提出了更聚焦的第二轮实验假设。其中一个有用的后续发现是:TEMPO 可以被性能损失极小但成本低得多的类似物 4-hydroxy-TEMPO 替代。

关键要点

  • 近自主工作流: 这是一个“近自主”而非完全自主的系统。AI 负责提出研究想法、设计实验、分析数据;人类负责高级引导、提案筛选、关键决策修正(如溶剂选择)以及最终结果的独立验证。
  • 突破低产率瓶颈: 针对历史上产率较低的伯磺酰胺与硼酸的 Chan-Lam 偶联反应,AI 成功找到了优化方案,显著提高了反应的可预测性和实用性。
  • 数据规模决定可靠性: 通过执行超过 10,000 次反应的大规模筛选,系统避免了小样本测试的误导性,确认了添加剂(TEMPO)在不同底物组合中的普遍有效性。
  • 成本优化潜力: AI 不仅提高了产率,还发现了更便宜的替代添加剂(4-hydroxy-TEMPO),为工业化应用提供了经济可行的路径。
  • 从微观到宏观的验证: 实验结果不仅在高通量的微升规模筛选中得到验证,也在更接近实际实验室环境的工作台规模手动重复实验中得到了确认,证明了其从理论到实践的转化能力。
  • 人类在环(Human-in-the-loop): 尽管 AI 提出了令人惊讶的氧化剂建议,但人类科学家的专业知识对于排除潜在干扰(如 DMSO 的反应性)和最终验证至关重要。

意义与影响

这一成果是 OpenAI 向“AI 成为科学家在整个研究循环中宝贵合作伙伴”这一更广泛方向迈出的具体一步。

1. 解决药物发现的关键瓶颈 有机化学是所有小分子药物的基础。合成往往是药物发现的主要瓶颈,因为科学家只能测试他们能够制造或获得的分子。如果反应产率低或副产物过多,化学家可能不得不放弃有前景的分子或花费大量时间开发替代路线。提高 Chan-Lam 偶联反应的可靠性,为药物化学家提供了一种更广泛、更实用的方法来生产和探索潜在有用的分子。

2. 验证 AI 在实证科学中的价值 在药物化学中,进步不能仅靠推理衡量,必须通过实验验证。本项目证明了 AI 不仅能进行文献综述和假设生成,还能通过连接自动化实验室,执行大规模实验并分析数据,最终得出人类化学家可以评估的科学发现。

3. 互补能力的结合 该系统展示了互补能力的结合:科学家编写的提示词用于 GPT-5.4 生成和排名数千个研究提案,人类筛选出最有希望的提案,Maria AI 将其转化为详细的实验室指令并执行高通量实验,最后将结构化结果返回给 GPT-5.4 进行进一步分析。这种人机协作模式为加速基础科学研究提供了新的范式。

4. 对更广泛领域的影响 虽然目前成果仍处于早期阶段,但它为农业、电子学和材料科学等领域提供了启示。当一种反应能够在许多不同的起始材料中可靠地形成相同类型的化学键时,其价值尤为巨大。AI 辅助的化学优化有望加速这些领域中新材料和新药物的发现进程。

查看原文 →openai.com