基于驱动基因突变对肝内胆管癌聚类,得到具有明显的分子特征和治疗脆弱性的临床相关的类群
背景介绍
胆管癌是指胆管上皮细胞恶性增殖,形成的肿瘤。主要分为3种类型:肝内胆管癌、肝门部胆管癌和肝外胆管癌。肝内胆管细胞癌(ICC)又叫胆管细胞性肝癌,它在解剖学上与肝外胆管癌(ECC)不同,是仅次于肝细胞肝癌(HCC)的第二大常见原发性肝恶性肿瘤,发生率约10~15%,男性略大于女性。具有高侵袭性和转移性,大部分ICC患者都在癌症晚期时才被诊断出。外科手术是ICC的首选治疗方法。目前对ICC的病因尚不完全清楚,可能与肝内胆管结石,病毒性肝炎、2型糖尿病(T2DM)、肝硬化、原发性硬化性胆管炎(PSC)、先天性胆道畸形等有关。此外,寄生虫感染(肝吸虫病)、有毒有害物质的暴露、代谢异常(糖尿病和肥胖)也被认为是肝内胆管细胞癌的危险因素。部分ICCs来源于大胆管的成熟胆管细胞,与ECC主要相似;而其他亚型来源于黑林管的小胆管或祖细胞,甚至具有HCC的某些特征。其病因和细胞来源的多样性表明ICC肿瘤发生的复杂机制。因此,迫切需要建立一套有效的ICC临床分类系统。
基因组学特征层面而言,TP53、KRAS和SMAD4突变已被确定为东方国家ICCs患者中最多的突变,主要病原包括流行肝吸虫、病毒性肝炎和肝内胆管结石。相反,患者中 IDH1/2、BAP1、PBRM1突变和FGFR2融合情况在西方国家更为普遍。从遗传学角度来说,驱动基因突变之间存在潜在的功能依赖网络,具有潜在的生物学和临床影响。迄今为止,人类癌症的大规模基因图谱提供了证据,证明了特定致癌基因突变之间共发和互斥的非随机模式,这为癌症发展提供了深刻的启示。
数据情况
1. 突变数据
研究队列:2013-2020年期间发表的24篇相关文献中的805例ICC患者数据。数据类型主要有STS、WGS和WES三种。
内部验证集:225例ICC患者,包括肿瘤分期信息。
独立ICC队列:包括一个212例来自MSKCC的ICCs和158例来自cbioportal数据集的ICCs队列和一个TIGER-LC和ICGC中的239例ICCs队列。
生存分析数据集:来自TCGA和ICGC中的178例ECCs。
2. 基因表达数据:9个CCA的基因表达数据集。
3. 甲基化数据集(450K):GSE32079、GSE49656和GSE89803
结果
1. ICC中驱动基因突变的概览
首先作者在图1A中展示了本研究整体的一个流程设计。在本研究中,通过对505例WES/WGS和300例STS数据分析发现,有22个基因在至少70%的样本中突变频率大于2%。其中突变频率最高的基因是TP53、KRAS、IDH1/2、ARID1A、 BAP1、PBRM1、FGFR2 融合、CDKN2A、SMAD4、PIK3CA和EPHA2(突变频率> 5%)。所有这些基因都进行了一系列相关性的检验(如图1B)。最后,在21个突变基因组合中发现了统计学上显著的突变基因对(共同出现或互斥),包括12个正相关和9个负相关(图1C-D)。
2. 通过七个驱动基因的成对相关性定义三个突变群
接下来,研究人员根据7个基因(TP53、KRAS、SMAD4、IDH1/2、FGFR2融合和BAP1)的高突变频率和强成对相关性提出一个新的聚类方式。Cluster1至少有一个KRAS/TP53/SMAD4突变;至少有一个IDH/FGFR2-fus/BAP1突变且没有KRAS/TP53/SMAD4突变的为Cluster2;而在Cluster3中上述基因均为野生型。根据上述策略,利用研究队列中505例样本的WES/WGS数据对堂本进行聚类。167例(33.1%)和117例(23.2%)分别携带Cluster1和Cluster2突变,同时这两类之间具有很强的互斥性。具体所有的样本的聚类情况如图1D所示。
3. 在其他队列中验证聚类方式的可靠性
为了证明上述聚类方式是稳定可靠的,研究人员又将这种方式应用到了其他样本数据中。在研究队列的STS数据中也发现了Cluster1突变和Cluster2突变也倾向于相互排斥,同时,Cluster1和Cluster2基因的突变频率分别为36.9%(97/263)和27.8%(73/263)。此外,他们在另外三个队列中也得到了类似的效果。
4. 临床因素对Cluster1和Cluster2突变互斥性的影响
既然本文的研究对象是临床相关的肿瘤病人,那么通过上述聚类方式得到的cluster的临床特征又是什么样的呢?研究发现,Cluster1和Cluster2突变在不同性别(男性/女性)、年龄(≥65 / < 65)和病因之间具有相似的互斥优势比(ORs)。值得注意的是,肿瘤分期对Cluster1和Cluster2突变的互斥性影响最大。III/IV期患者Cluster1和Cluster2突变的OR比I/II期患者高出3倍以上。在这些样本中,有16例具有临床分期信息的病例是Cluster1/2共突变类型的,其中14例为III/IV期(87.5%),这明显高于仅具有Cluster1突变(66.2%)或Cluster2突变(55%)的病例。研究人员推测这种罕见的Cluster1/2共突变模式可能是肿瘤进化的结果。
5. 不同的突变群表现出不同的临床病理特征
其次,研究人员比较了不同聚类的临床病理特征。Cluster1突变在东方人群中更常见,而Cluster2突变在西方人群中更常见(图2A)。从病因角度来说,Cluster2多见于无明确危险因素的ICCs和病毒性肝炎相关的ICCs,但在肝吸虫感染或肝结石病例中很少发现。而Cluster1A和Cluster1B在病毒性肝炎、肝吸虫感染和肝内结石等肝病病例中更常见(图2B)。在图2C中可以看到转移性病例中Cluster1突变显著富集。在原发性肿瘤和转移性肿瘤之间,Cluster2突变的频率相似,而Cluster3突变在原发性肿瘤中比转移性肿瘤中更普遍。此外,Cluster1A ICCs的CA19-9水平最高,而Cluster2 ICCs的CA19-9水平远低于Cluster1A和Cluster1B(图2D)。与其他cluster相比,Cluster1A的ICCs在III/IV期患者中更富集(图2E)。
根据组织学形态分类,ICC可分为小胆管型和大胆管型。因此研究人员还关注了内部验证队列中的94例ICC病例的不同突变cluster的组织学表型。值得注意的是,大多数Cluster1型ICCs,特别是Cluster1A型ICCs的组织形态主要表现为大胆管,而Cluster2型ICCs主要表现为小胆管(图2F)。
6. 不同突变群的ICCs表现出不同的临床特征
如图3A所示,Cluster1突变与较差的总生存期(OS)和无复发生存期(RFS)显著相关。相比之下,Cluster2突变的病例与Cluster3 ICCs相比,Cluster2的RFS相似,但OS相对较长。在Cluster1病例中,Cluster1A和1B ICC病例的预后同样较差。此外,研究人员还发现Cluster1突变状态在手术切除的ECS中没有显示显著的预后价值。这表明观察到的突变cluster的预后价值可能是ICC特异性的。
然后,研究人员还研究了不同突变cluster在接受治疗的晚期ICCs中的预后价值。在来自MSKCC队列的104例接受治疗的转移性/复发性ICCs中,与Cluster2/3的患者相比,Cluster1的患者在治疗中进展率更高,OS相对更差,尽管其生存差异没有统计学意义(图3C)。
7. Cluster1突变与侵袭性和预后不良相关分子特征有关
分析完组织样本数据,为了研究突变cluster之间预后差异,研究人员还分析了15个胆管癌细胞系的突变情况。利用基于238个基因富集评分的监督聚类方式,可以在5个独立的基因表达谱数据集中将胆管癌病例分为3组 (图3D)。结果发现Cluster1的ICCs和ECC病例大多富集在“预后不良”亚型,而Cluster2的ICCs大多集中在“预后良好”亚型。
8. 不同的突变群表现出不同的组织学和谱系相关的分子特征
利用目前已报道的胆管细胞分化基因表达标记(CD标记),可以将CCA样本分成不同的三种CD表型(图4A)。大多数Cluster2的ICCs属于CD亚型,而Cluster1的ICCs和ECCs大多聚为非CD表型或混合表型(图4A)。利用肝干细胞样(HpSC)基因表达特征可以在上述三个队列中将CCAs进一步分为三种亚型 (图4B)。大多数Cluster2型ICC病例富集于HpSC亚型,而Cluster1型ICC和ECCs多分为非HpSC或混合表型。在DNA甲基化层面研究发现Cluster2的ICCs表现出明显高于Cluster1的ICCs的DNA甲基化水平,在Cluster2的ICCs中,FGFR2融合或BAP1突变的ICCs(没有IDH1/2突变)与IDH突变的ICCs表现出相似的DNA甲基化模式(图4C)。此外研究人员还发现了不同的致癌基因表达标记在不同的cluster中。例如Cluster1在ICC中显示了一系列此前已报道的转移或进展相关基因的最高表达水平,如TMPRSS4、S100A4、S100P、PTEGS、MUC1、COX-2、IL-6和CEACAM6。
9. IDH/FGFR2融合/BAP1和TP53/SMAD4共突变模式进一步定义了两种预后不同的HCC亚型
根据目前的研究报道,HCC、ICC和CHC这三种最常见的原发性肝癌(PLC)亚型有时会表现出重叠表型,如胆管癌样HCC (CLHCC)亚型。使用CCA-like特征(CC signature)可以将407个TCGA-PLC(373个HCC、36个CCA和10个CHC)队列分为一个连续性的肝癌谱系。其中175例HCC/CHC病例显示类似CCA的特征,并与36例CCA病例聚集在一起,表明它们本质上与CCA分子特征相似(图5A)。与之前的研究一致,CCA、CLHCC和经典HCC的预后不同(图5B)。谱系特异性标志物(EPCAM、CD133、KRT19、CEACAM6、HNF4A和ALB)在这三种亚型中也是差异表达的(图5C)。与分化良好的HCC的组织学形态相比,这些CLHCCs的显微镜下特征表现为“CCA-like型”(图5D)。同时,研究人员还发现TP53/SMAD4突变和IDH/FGFR2-fus/BAP1突变的百分比显著升高,而CTNNB1在CLHCC亚型中的突变率低于经典HCC亚型(图5A)。与ICC一致,这两类cluster也倾向于相互排斥(图5E),与Cluster2 CLHCCs相比,Cluster1B CLHCCs的OS和RFS也明显更短(图5F)。
10. 具有不同聚类突变的ICC细胞对分子靶向治疗表现出不同的敏感性
考虑到Cluster1和Cluster2 ICCs之间的分子差异,研究人员认为比较它们对分子靶向治疗的响应可能也是不一样的。一共筛选了六种ICC细胞系(包括两种Cluster1A:两种Cluster1B和两种Cluster2A突变细胞系)进行研究。细胞活性检测表明,没有化合物可以选择性地降低Cluster1A和1B突变ICC细胞的活性(图6A)。与Cluster1A突变细胞相比,Cluster2A突变ICC细胞对Dasatinib、Vorinostat、JQ1、iBET、Olaparib和Niraparib表现出更高的敏感性(图6A-B)。同时,JQ1和Vorinostat显著抑制Cluster2A (IDH1突变)ICC细胞,但不抑制Cluster1A (KRAS/TP53突变)ICC细胞(图6C)。这项分析表明,ICCs的分子亚型可能与特定靶向治疗的独特敏感性有关。研究人员还指出,基于ICC不同突变cluster的更大规模药物筛选值得进一步研究。
11. 结合基因表达谱数据筛选ICCs的特异性生物标志物
综上所述,Cluster1A和Cluster2 ICCs具有明显的临床特征。通过比较这两类的基因表达数据得到了52个明显差异表达的基因。在这些基因中,前两个基因S100P和KRT17都是CCA生存特征和ICC复发特征的预后标记,同时也是CD特征的标记(图7A)。研究人员构建了一个临床病理评分(CP评分)系统,CP分数低(0和1)可以很好地定义Cluster2的ICCs,而Cluster1的ICCs大多富集于CP分数高的组中(图7B)。该评分系统还可以将Cluster3病例分为两个具有明显临床和生物学相关性的亚群(图7C-D)。
总而言之,S100P和KRT17结合CA19-9可能作为谱系指示标记,有助于ICC突变cluster的鉴别。结合聚类突变和亚型特异性的生物标志物,研究人员最终提出了一种临床适用的聚类策略,它可以指导ICC预后分层、分子分类和治疗优化(图8)。
结论
在本研究中,研究人员通过研究驱动基因突变的成对相关性或互斥性,揭示了ICC多样性的突变基础。总而言之,研究人员人员对筛选出的7个突变基因的进行突变检测,结合S100P/KRT17表达和CA19-9水平的评估,是鉴定临床和生物学上不同亚型ICC的可靠生物标志物。此外,他们还发现不同的突变cluster具有不同的肿瘤发生机制,因此药物反应性也不同,这将为恶性肿瘤的治疗提供更精确的治疗策略。