← 返回信息流
AI 资讯雷峰网·3 小时前

Latent Labs创始人Simon Kohl:AI让生物学进入可编程时代

原标题:从诺奖项目到生成式药物设计,Latent Labs 创始人 Simon Kohl:AI 正在让生物学进入「可编程时代」 | CVPR 2026

速览

在CVPR 2026大会上,Latent Labs创始人Simon Kohl展示了从AlphaFold 2到生成式AI的技术跃迁。公司发布了全球首个实验室验证的抗体设计智能体Latent-Y,仅需自然语言提示即可自主完成分子设计。这标志着计算药物设计正以指数级速度演进,生物学有望成为可编程的工程学科。

AI 深度解读

背景

2026年6月3日,计算机视觉与模式识别顶级会议(CVPR)在美国丹佛举行。前 DeepMind 蛋白质设计团队核心成员、2024年诺贝尔化学奖获奖项目 AlphaFold 核心研究员、Latent Labs 创始人兼 CEO Simon Kohl 发表了题为“Programmable Biology:Generative AI for Molecular Design”的特邀演讲。

当前药物发现领域面临巨大的痛点:一种新药从研发到上市平均耗时超过10年,花费超20亿美元,但九成候选药物最终失败。Simon Kohl 认为,这一困境的根源在于传统方法往往从“错误的分子”出发。他提出了一条从“结构预测”到“条件生成”再到“自主智能体”的技术跃迁路线,旨在通过生成式 AI 实现从头设计药物,从而提升成功率、降低成本并加速研发进程。

核心内容

药物发现的困境与破局思路

传统药物发现流程漫长且昂贵,主要依赖三种获取初始筛选材料的方式:体内免疫法(如利用羊驼或鲨鱼)、超大规模库筛选(类似“扔意大利面”式的随机筛选)以及 B 细胞挖掘(从幸存者血液中提取)。这些方法存在不可控、亲和力弱、成本高或无法规模化等缺陷。

Simon Kohl 提出,通过生成式 AI,可以将靶点输入模型,即时产出具有高特异性结合、可制造性、低多反应性等属性的药物分子,实现“生物学可编程”。

技术演进:从 AlphaFold 2 到智能体

过去五年,计算药物设计经历了指数级加速:

  1. 结构预测突破:2020年 AlphaFold 2 解决了蛋白质结构预测问题,其架构核心包括多序列比对(MSA)、配对表征和结构模板,通过 EvoFormer 架构融合进化信号与几何先验,实现了接近实验精度的预测。
  2. 生成式设计兴起:随后 RFdiffusion、ProteinMPNN 等模型问世。2024年 AlphaFold 3 增加了蛋白质相互作用建模能力。
  3. 抗体设计突破:抗体设计被视为该领域的“圣杯”。Latent Labs 相继推出了 Latent—X1(通用蛋白结合物设计)和 Latent—X2(零样本抗体设计)。
  4. 智能体闭环:最新发布的 Latent—Y 是全球首个实验室验证的抗体设计智能体,能自主完成从靶点分析到分子设计的全流程。

Latent Labs 的核心模型与成果

  • Latent—X1(通用蛋白结合物设计)

    • 原理:将靶点表示为原子坐标点云,利用去噪扩散模型从高斯噪声中生成结合物。
    • 验证:在纳米抗体和迷你结合蛋白(Mini-binder)设计中,实现了纳摩尔至皮摩尔级别的亲和力,命中率超越同期其他模型。
    • 流程:给定靶点 -> 指定结合位点 -> 生成结合物 -> AlphaFold 交叉验证 -> 湿实验室验证(如荧光标记结合实验)。
  • Latent—X2(零样本抗体设计)

    • 突破:能够针对从未见过的靶点从头设计药物级抗体,涵盖纳米抗体、单域抗体等多种格式。
    • 药物相似性:47% 的候选物无需迭代优化即可跨过热稳定性、单体性、产量、多反应性等关键指标阈值。
    • 效率对比:在 PHD2 和 KRAS(传统“不可成药”靶标)上,仅用10个设计即达到甚至超越万亿级随机筛选库的结合力。AI 计算耗时1天,实验室验证4周;而传统筛选需3-6个月。
    • 应用案例:成功设计环肽阻断人类 NAV1.7 钠离子通道,用于镇痛药物研发。
  • Latent—Y(抗体设计智能体)

    • 功能:全球首个实验室验证的抗体设计智能体。用户仅需输入自然语言提示(如“生成阻断人 IL-6 的纳米抗体”),智能体即可并行执行靶点分析、分子设计等步骤。
    • 能力:可直接读取《Science》或《Nature》论文 PDF,识别生物学功能并设计对应纳米抗体。在针对20篇论文的测试中,针对 Transferrin 受体 1 的设计任务,40个候选物中有11个在实验室成功结合。

开放问题与未来展望

尽管进展显著,领域仍面临三大挑战:

  1. 蛋白质动力学:目前模型多为静态建模,而蛋白质是动态柔性物体。机器学习力场(ML Force Fields)有望解决传统力场泛化性差的问题,但精度和计算量仍是瓶颈。
  2. 人体药物响应预测:缺乏足够数据,难以可靠预测人体内的药物反应。
  3. 系统性毒性预测:人体交互网络庞大且未被充分理解,存在数据瓶颈。

Simon Kohl 预测,未来5-10年,随着技术进步汇聚,生物学将彻底成为一门可编程的工程学科,人类有望攻克所有疾病。

关键要点

  • 范式转变:药物设计正从“筛选现有分子”转向“从头生成分子”,从“静态结构预测”转向“动态条件生成”及“自主智能体闭环”。
  • AlphaFold 2 的基础作用:不仅解决了结构预测难题,还构建了“数据集→评估→预测器→生成器”的产业飞轮,为生成式 AI 提供了关键的验证器(Oracle)。
  • Latent—X1 的性能:在通用蛋白结合物设计中,实现了媲美甚至超越传统万亿级筛选的命中率和亲和力,特别是在纳米抗体和迷你结合蛋白领域表现优异。
  • Latent—X2 的零样本能力:能够针对未见过的靶点设计药物级抗体,且在药物相似性(稳定性、可制造性等)方面表现卓越,效率远超传统筛选。
  • Latent—Y 的自主性:作为全球首个实验室验证的智能体,实现了自然语言驱动的全流程自动化设计,大幅提升了研发效能。
  • 湿实验室验证的重要性:尽管 AI 生成能力强,但“一个氨基酸的偏差”可能导致功能丧失,因此湿实验室验证(如荧光标记、细胞系表达)仍是不可或缺的最后关卡。
  • 数据与动力学挑战:当前模型主要基于静态结构,蛋白质动力学、人体药物响应及系统性毒性预测仍受限于数据质量和计算能力。
  • 合成数据的作用:即使在 AlphaFold 2 中,合成数据(自蒸馏数据)与实验室数据的比例已达 3:1,表明合成数据在模型训练中的重要性日益增加。

意义与影响

Simon Kohl 的演讲揭示了 AI 在生命科学领域的深层变革:生物学正在从一门观察性科学转变为一门可编程的工程学科。

  1. 研发效率的指数级提升:通过生成式 AI 和智能体技术,药物发现的周期有望从10年缩短至数月甚至数周,成本从数十亿美元降至极低水平。例如,Latent—X2 在 KRAS 靶标上的设计仅耗时1天,而传统方法需数月。
  2. 攻克“不可成药”靶点:AI 生成的分子能够突破传统筛选库的物理限制,针对如 KRAS 等长期被认为“不可成药”的靶点提供有效解决方案,拓展了治疗可能性。
  3. 从预测到创造的闭环:AlphaFold 2 解决了“看”的问题,而 Latent Labs 的模型解决了“造”的问题。结合智能体 Latent—Y,形成了从靶点识别、分子设计到实验室验证的自动化闭环,极大降低了研发门槛。
  4. 数据驱动的新范式:强调了合成数据和自动化实验数据在训练下一代模型中的关键作用。随着数据异构性问题的解决和自动化实验室 API 的接入,AI 模型的迭代速度将进一步加快。
  5. 对制药行业的重塑:传统药企依赖的大型动物农场和海量筛选库模式将被基于计算的精准设计所取代。未来,药物研发将更加依赖算法算力而非物理试错,这将彻底改变制药行业的竞争格局。
查看原文 →leiphone.com