← 返回信息流
AI 资讯雷峰网·3 小时前

ICML 2026:上智院等提出FLAG框架,还原空间转录组基因-空间结构

原标题:ICML 2026|上智院、上交大、复旦联合提出FLAG扩散框架,还原空间转录组的基因-空间双重结构

速览

上海科学智能研究院联合上交大、复旦提出FLAG框架,将空间转录组预测从确定性回归重构为结构化分布建模。该框架利用空间图编码器与基因基础模型对齐,有效破解高维场景下的「基因维度诅咒」,在结构保真度上显著领先。成果已被ICML 2026接收,为连接低成本影像与高维分子信息提供了新范式。

AI 深度解读

ICML 2026|FLAG:破解空间转录组生成的“基因维度诅咒”

背景

空间转录组学(Spatial Transcriptomics, ST)技术能够在保留细胞空间位置信息的同时测量基因表达,对于解析组织微环境、理解疾病微生态具有至关重要的意义。然而,传统的 ST 技术存在测序成本高、通量低等局限。相比之下,H&E 染色的全切片图像(WSI)在临床病理诊断中已广泛获取,成本极低且易于获得。因此,“以图测谱”——即直接从常规病理图像预测空间基因表达,成为连接低成本影像数据与高维分子信息的关键桥梁。

尽管前景广阔,现有方法面临两大瓶颈:

  1. 只见数值,不见结构:多数判别式方法将任务简化为对每个基因独立的逐点回归。这种处理方式忽略了生物学中关键的“基因-基因”调控关系和“基因-空间”分布关系,导致生成的表达图谱虽然逐点指标(如 PCC、MSE)尚可,但缺乏生物学意义上的结构保真度,即“形似而神不似”。
  2. 图扩散遭遇“基因维度诅咒”:试图在图上联合去噪节点与边的“图扩散”方法在小基因集上有效,但随着基因维度升高,优化稳定性急剧恶化甚至崩溃。团队从理论上揭示了这一现象:在高维场景下,经验相关性急剧集中,迫使模型逼近曲率极高的得分场,超出了神经网络的逼近能力。

核心内容

针对上述挑战,上海科学智能研究院(SAIL)、上海交通大学、复旦大学等机构联合提出了结构感知的潜扩散框架 FLAG(Foundation model representation with Latent diffusion Alignment via Graph)。该成果已被 ICML 2026 接收。

任务重新定义:从确定性回归到结构化分布建模

FLAG 将“病理图像→空间转录组”的任务从传统的确定性回归重新定义为结构化分布建模。由于组织形态到基因表达的映射本质上是一对多的关系,FLAG 采用扩散生成范式,显式逼近高维概率流形,而非仅拟合条件期望。这使得模型能够保留逐点目标所忽略的内在相关性,从而更真实地还原生物学结构。

破解“基因维度诅咒”

FLAG 创新性地解决了高维场景下的优化崩溃问题:

  • 机制:不再在图上联合去噪节点与边,而是将可靠的拓扑结构作为固定先验。
  • 实现:利用空间图编码器一次性聚合为对基因维度稳定的空间上下文,再以此引导基因维度的扩散过程。
  • 效果:将高方差的“联合生成”转化为稳定的“条件生成”,从根本上规避了高维下优化下界恶化导致的训练崩溃。

注入生物先验:基础模型对齐

FLAG 在扩散主干的中间层引入了对齐损失,将隐表示对齐至冻结的预训练基因基础模型(如 GeneformerscGPTCellPLM)。

  • 角色分工:空间图编码器充当“空间画布”,条件扩散 Transformer 充当“生成引擎”,基因基础模型提供“生物规则”。
  • 部署优势:该生物先验仅在训练阶段使用,推理时无需调用相关基础模型,几乎不增加部署成本。

实验验证与性能

团队提出了两项新的结构化评估指标:

  • 基因结构相关性(GSC):衡量基因调控网络拓扑的保留程度。
  • 空间结构相关性(SSC):通过 Moran's I 衡量空间自相关模式的保留程度。

HEST-1k 基准的 HER2ST、KIDNEY、PRAD 三个数据集上,FLAG 在保持 PCC/MSE 高度竞争力的同时,结构指标全面领先。例如,在 HER2ST 数据集上,其 SSC 达到同类生成式方法 STFlow 的两倍以上,GSC 居所有方法之首。

在直面“基因维度诅咒”的专项实验中,即便在基因数量 G=800 的高维设置下,FLAG 仍显著优于基线方法,证明其具备扩展至更大规模、更具生物学代表性基因面板的能力。此外,得益于离线预计算与冻结编码器策略,FLAG 在单卡(NVIDIA H800)上的训练效率极高(约 35 秒/轮,峰值显存约 4.5GB),开销与现有生成式模型相当。

关键要点

  • 理论突破:首次系统揭示并刻画了高维场景下的“基因维度诅咒”(Gene Dimension Curse),从理论上解释了高维下联合扩散崩溃的原因(优化下界 $L_{(joint)} - L_{(node)} \ge \Omega(G)$)。
  • 框架创新:提出 FLAG 框架,巧妙融合预训练基础模型表征能力与扩散生成的分布建模能力,实现了“空间画布”、“生成引擎”与“生物规则”的协同。
  • 结构保真度:通过引入 GSC 和 SSC 指标,证明了 FLAG 在还原基因调控网络拓扑和空间自相关模式方面的显著优势,解决了传统方法“形似神不似”的问题。
  • 高效部署:生物先验对齐仅在训练时使用,推理阶段无需调用大型基础模型,且训练资源消耗低,具备良好的实际应用潜力。
  • 下游应用价值:FLAG 成功恢复了雌激素早期反应通路清晰的块对角调控簇,在差异表达基因(DEG)发现、空间域识别(ARI 0.8451, NMI 0.9140)等下游任务中大幅优于对比方法,聚类结果接近真值上界。
  • 消融实验证实:确定性回归替换扩散主干会导致结构保真度塌缩;移除基因基础模型对齐会损害精度与空间一致性;移除空间图编码器则破坏空间结构保真度,三者缺一不可。

意义与影响

FLAG 的研究为“病理图像→空间转录组”的生成任务确立了兼顾精度与结构保真度的新范式。其核心贡献在于跨越了从“拟合数值”到“还原生物学结构”的鸿沟,证明了 AI 驱动生命科学不仅需要预测准确的数值,更需要保持生物学结构的内在一致性。

该研究再次印证了 AI 在生命科学领域的巨大潜力:通过模块化、与具体基础模型解耦的设计,FLAG 不仅解决了当前的技术瓶颈,也为未来集成更强的病理与基因基础模型预留了空间。未来,团队计划探索扩散推理加速、将图主干扩展至三维组织依赖,并攻克跨组织零样本泛化问题,为可扩展、生物学一致的空间转录组生成与计算病理持续注入新动力。

论文地址:https://arxiv.org/abs/2605.18055 代码地址:https://github.com/darkflash03/FLAG

查看原文 →leiphone.com