AI 资讯雷峰网·3 小时前

ICML 2026：上智院等提出FLAG框架，还原空间转录组基因-空间结构

原标题：ICML 2026｜上智院、上交大、复旦联合提出FLAG扩散框架，还原空间转录组的基因-空间双重结构

速览

上海科学智能研究院联合上交大、复旦提出FLAG框架，将空间转录组预测从确定性回归重构为结构化分布建模。该框架利用空间图编码器与基因基础模型对齐，有效破解高维场景下的「基因维度诅咒」，在结构保真度上显著领先。成果已被ICML 2026接收，为连接低成本影像与高维分子信息提供了新范式。

AI 深度解读

ICML 2026｜FLAG：破解空间转录组生成的“基因维度诅咒”

背景

空间转录组学（Spatial Transcriptomics, ST）技术能够在保留细胞空间位置信息的同时测量基因表达，对于解析组织微环境、理解疾病微生态具有至关重要的意义。然而，传统的 ST 技术存在测序成本高、通量低等局限。相比之下，H&E 染色的全切片图像（WSI）在临床病理诊断中已广泛获取，成本极低且易于获得。因此，“以图测谱”——即直接从常规病理图像预测空间基因表达，成为连接低成本影像数据与高维分子信息的关键桥梁。

尽管前景广阔，现有方法面临两大瓶颈：

只见数值，不见结构：多数判别式方法将任务简化为对每个基因独立的逐点回归。这种处理方式忽略了生物学中关键的“基因-基因”调控关系和“基因-空间”分布关系，导致生成的表达图谱虽然逐点指标（如 PCC、MSE）尚可，但缺乏生物学意义上的结构保真度，即“形似而神不似”。
图扩散遭遇“基因维度诅咒”：试图在图上联合去噪节点与边的“图扩散”方法在小基因集上有效，但随着基因维度升高，优化稳定性急剧恶化甚至崩溃。团队从理论上揭示了这一现象：在高维场景下，经验相关性急剧集中，迫使模型逼近曲率极高的得分场，超出了神经网络的逼近能力。

核心内容

针对上述挑战，上海科学智能研究院（SAIL）、上海交通大学、复旦大学等机构联合提出了结构感知的潜扩散框架 FLAG（Foundation model representation with Latent diffusion Alignment via Graph）。该成果已被 ICML 2026 接收。

任务重新定义：从确定性回归到结构化分布建模

FLAG 将“病理图像→空间转录组”的任务从传统的确定性回归重新定义为结构化分布建模。由于组织形态到基因表达的映射本质上是一对多的关系，FLAG 采用扩散生成范式，显式逼近高维概率流形，而非仅拟合条件期望。这使得模型能够保留逐点目标所忽略的内在相关性，从而更真实地还原生物学结构。

破解“基因维度诅咒”

FLAG 创新性地解决了高维场景下的优化崩溃问题：

机制：不再在图上联合去噪节点与边，而是将可靠的拓扑结构作为固定先验。
实现：利用空间图编码器一次性聚合为对基因维度稳定的空间上下文，再以此引导基因维度的扩散过程。
效果：将高方差的“联合生成”转化为稳定的“条件生成”，从根本上规避了高维下优化下界恶化导致的训练崩溃。

注入生物先验：基础模型对齐

FLAG 在扩散主干的中间层引入了对齐损失，将隐表示对齐至冻结的预训练基因基础模型（如 Geneformer、scGPT、CellPLM）。

角色分工：空间图编码器充当“空间画布”，条件扩散 Transformer 充当“生成引擎”，基因基础模型提供“生物规则”。
部署优势：该生物先验仅在训练阶段使用，推理时无需调用相关基础模型，几乎不增加部署成本。

实验验证与性能

团队提出了两项新的结构化评估指标：

基因结构相关性（GSC）：衡量基因调控网络拓扑的保留程度。
空间结构相关性（SSC）：通过 Moran's I 衡量空间自相关模式的保留程度。

在 HEST-1k 基准的 HER2ST、KIDNEY、PRAD 三个数据集上，FLAG 在保持 PCC/MSE 高度竞争力的同时，结构指标全面领先。例如，在 HER2ST 数据集上，其 SSC 达到同类生成式方法 STFlow 的两倍以上，GSC 居所有方法之首。

在直面“基因维度诅咒”的专项实验中，即便在基因数量 G=800 的高维设置下，FLAG 仍显著优于基线方法，证明其具备扩展至更大规模、更具生物学代表性基因面板的能力。此外，得益于离线预计算与冻结编码器策略，FLAG 在单卡（NVIDIA H800）上的训练效率极高（约 35 秒/轮，峰值显存约 4.5GB），开销与现有生成式模型相当。

关键要点

理论突破：首次系统揭示并刻画了高维场景下的“基因维度诅咒”（Gene Dimension Curse），从理论上解释了高维下联合扩散崩溃的原因（优化下界 $L_{(joint)} - L_{(node)} \ge \Omega(G)$）。
框架创新：提出 FLAG 框架，巧妙融合预训练基础模型表征能力与扩散生成的分布建模能力，实现了“空间画布”、“生成引擎”与“生物规则”的协同。
结构保真度：通过引入 GSC 和 SSC 指标，证明了 FLAG 在还原基因调控网络拓扑和空间自相关模式方面的显著优势，解决了传统方法“形似神不似”的问题。
高效部署：生物先验对齐仅在训练时使用，推理阶段无需调用大型基础模型，且训练资源消耗低，具备良好的实际应用潜力。
下游应用价值：FLAG 成功恢复了雌激素早期反应通路清晰的块对角调控簇，在差异表达基因（DEG）发现、空间域识别（ARI 0.8451, NMI 0.9140）等下游任务中大幅优于对比方法，聚类结果接近真值上界。
消融实验证实：确定性回归替换扩散主干会导致结构保真度塌缩；移除基因基础模型对齐会损害精度与空间一致性；移除空间图编码器则破坏空间结构保真度，三者缺一不可。

意义与影响

FLAG 的研究为“病理图像→空间转录组”的生成任务确立了兼顾精度与结构保真度的新范式。其核心贡献在于跨越了从“拟合数值”到“还原生物学结构”的鸿沟，证明了 AI 驱动生命科学不仅需要预测准确的数值，更需要保持生物学结构的内在一致性。

该研究再次印证了 AI 在生命科学领域的巨大潜力：通过模块化、与具体基础模型解耦的设计，FLAG 不仅解决了当前的技术瓶颈，也为未来集成更强的病理与基因基础模型预留了空间。未来，团队计划探索扩散推理加速、将图主干扩展至三维组织依赖，并攻克跨组织零样本泛化问题，为可扩展、生物学一致的空间转录组生成与计算病理持续注入新动力。

论文地址：https://arxiv.org/abs/2605.18055 代码地址：https://github.com/darkflash03/FLAG

查看原文 →leiphone.com