通过多模态深度学习进行泛癌集成病理-基因组分析.

0. TL; DR

本研究提出了PORPOISE (Pathology-Omics Research Platform for Integrative Survival Estimation),一个基于多模态深度学习的泛癌种分析框架。该框架能够联合审查病理学全切片图像(WSIs)和分子谱数据,用于癌症预后预测。

作者提出了一种弱监督的多模态深度学习算法,能够有效地融合这两种异构模态来预测结局,并发现与有利和不利结局相关的预后特征。通过结合基于注意力和基于归因的可解释性方法,该模型不仅能预测风险,还能揭示驱动预后的形态学和分子相关因素。

作者开发了一个名为PORPOISE的交互式、开放获取的在线平台。该平台允许研究人员在14种癌症类型、数千名患者中探索模型发现的形态学和分子预后标志物,从而推动新的生物标志物发现和特征评估。

作者在来自14个癌症类型的5,720个患者样本上训练和验证了该模型。结果表明,多模态数据融合显著改善了大多数癌症类型的预后模型性能。该研究为整合组织学和基因组学数据进行泛癌种预后分析提供了强有力的工具和宝贵的资源。

1. 背景介绍

癌症的定义包含其在组织病理学、基因组学和转录组学等多个层面的异质性,这种异质性导致了治疗反应和患者结局的多样性。

然而,癌症预后本质上是一个多模态问题。将组织病理学评估与分子生物标志物结合已成为某些癌症(如脑肿瘤)的临床标准。利用deep learning对这两种数据源进行多模态融合,不仅能提高患者风险分层的精确度,还有助于发现和验证新的、组合性的生物标志物。

尽管已有研究尝试预测分子变异或进行基因型-表型关联分析,但一个能够整合WSI和多维分子谱数据,并提供可解释的形态学和分子预后因素的泛癌种框架仍然缺失。本研究旨在填补这一空白。

2. 方法介绍

作者提出了一个multimodal fusion (MMF) 深度学习算法,该算法能够整合H&E WSIs和分子谱特征(突变状态、拷贝数变异、RNA测序表达)来预测癌症死亡的相对风险,并解释其预测依据。

2.1 多模态融合算法 (Multimodal Fusion Algorithm)

该算法由三个神经网络模块组成:

AMIL (Attention-based Multiple-Instance Learning)

AMIL用于处理WSIWSI被视为一个由多个patch实例组成的“bag”(包)。一个ResNet50编码器将每个patch转换为一个1024维的特征向量。一个attention module学习为每个patch分配一个注意力分数$a_m$,代表其对患者预后预测的相对重要性。通过attention-pooling将所有patch的特征加权聚合,得到一个患者级的WSI表示$h_{WSI}$。

\[a_m = \frac{\exp\left(W_a \left( \tanh(V_a h_m^u) \odot \text{sigm}(U_a h_m^u) \right)\right)}{\sum_{m=1}^M \exp\left(W_a \left( \tanh(V_a h_m^u) \odot \text{sigm}(U_a h_m^u) \right)\right)} \\ h_{patient} = \sum_{m=1}^M a_m h_m\]

SNN (Self-Normalizing Network)

SNN用于处理分子数据特征。SNN特别适合处理高维、小样本(HDLSS)的基因组学数据,因为它通过SeLU激活函数和Alpha Dropout来维持网络各层输出的自归一化特性,从而有效防止过拟合。SNN的最后全连接层输出一个患者级的分子表示$h_{molecular}$。

多模态融合层

作者使用Kronecker积来计算$h_{WSI}$和$h_{molecular}$的联合表示。这能捕捉到两种模态特征之间的所有成对交互。

\[h_{fusion} = \begin{bmatrix} h_{WSI} \\ 1 \end{bmatrix} \otimes \begin{bmatrix} h_{molecular} \\ 1 \end{bmatrix}\]

在融合之前,作者还使用了一个门控注意力机制来加权每个模态,以控制各自的表达能力,减少噪声特征的影响。

\[h_{i,gated} = z_i \odot h_i\]

其中,$z_i$是根据两种模态的联合信息计算出的注意力分数。

2.2 生存损失函数

为了处理右删失的生存数据,作者采用了离散时间生存模型。将连续的生存时间$T_{cont}$划分为4个非重叠的时间区间。模型预测的是在每个时间区间内发生事件的hazard function(风险函数)$f_{hazard}(r | h_{bag_j})$。通过累积乘积计算survival function(生存函数)$f_{surv}(r| h_{bag_j}) = \prod_{u=1}^r (1 - f_{hazard}(u| h_{bag_j}))$。最终的损失函数是一个基于负对数似然的NLL损失,它能够同时处理删失和未删失数据。

2.3 多模态可解释性与可视化

WSI可解释性:

分子特征可解释性:

作者将上述功能整合到一个名为PORPOISE的交互式在线平台中,方便研究人员探索模型发现的预后标志物。

3. 实验分析

作者在来自TCGA的14个癌症类型、5,720名患者的数据上进行了5折交叉验证,并将多模态融合(MMF)模型与单模态模型(AMILSNN)进行了比较。

3.1 多模态整合提升患者风险分层

3.2 多模态可解释性用于联合图像-组学生物标志物发现

作者以KIRC, KIRP, LGGs, PAAD四种癌症为例,展示了PORPOISE平台的可解释性分析。

KIRC的分析:

KIRP的分析:

LGGs的分析:

PAAD的分析:

3.3 免疫应答作为预后标志物

作者假设tumor-infiltrating lymphocyte (TIL)(肿瘤浸润淋巴细胞)的存在与有利的癌症预后相关,并使用PORPOISE的可解释性来验证这一假设。

通过量化高注意力区域中TIL的存在分数,作者发现,在14种癌症中的9种中,低风险患者的TIL分数显著高于高风险患者。这一发现与越来越多的证据表明TILs在多种癌症中具有预后作用的观点相符。

PORPOISE在没有被明确训练识别TILs的情况下,自发地将TIL的存在作为预测良好预后的形态学特征,这证明了其发现有意义的生物标志物的能力。