转移性癌症与患者预后不良相关,但其时间和空间发生趋势在早期仍不可预测。在这里,研究人员开发了MetaNet,一个计算框架,整合了来自32176例原发和转移性癌症病例的临床和测序数据,以评估原发肿瘤的转移风险。
MetaNet在鉴别乳腺癌和前列腺癌的转移和原发灶方面具有较高的准确性。从预测中,研究人员识别了具有转移特征的原发性肿瘤(MFP),这是一种具有基因组特征的原发性肿瘤的子集,在转移中聚集,并证明其较高的转移风险和较短的无病生存期。此外,研究人员识别了与器官特异性转移相关的基因组改变,并利用它们将患者分层为具有不同转移器官倾向的不同风险组。在前列腺癌中,这种嗜有机分层方法比标准的组织学分级系统具有更好的预后价值,特别是在骨MFP和肝MFP亚型的识别方面,具有指导后续器官特异性检查的潜力。
转移,即肿瘤细胞扩散到远处的器官,是大多数癌症相关死亡的原因。部分原因是由于转移灶扩散超出临床控制时诊断较晚。目前标准的TNM系统根据原发肿瘤大小(T)、淋巴结扩散(N)、一个原因是,转移癌可能在远端器官中播散,而不是在临床上可测量的大小上成为显性转移。
以前的研究发现,转移瘤细胞一旦到达远处的器官,就可以进入休眠状态而不生长。到目前为止,根据标准的TNM指标,在明显转移前,很少有办法定量评估原发肿瘤的转移风险(例如,何时和何地转移)。高通量技术使识别分子特征预测癌症转移和进展成为可能。2003年,Ramaswamy等人通过比较12个转移性和64个原发肿瘤样本,从微阵列数据中确定了一个与转移相关的基因表达特征,并在279个原发实体肿瘤的独立队列中验证了具有该特征的患者与转移和不良临床结果相关。临床肿瘤DNA测序方法,如MSK-IMPACT和FoundationONE,已经证明其在指导原发和转移性癌症治疗选择方面的临床效用。
此外,拷贝数变异负荷是癌细胞的一个常见基因组特征,被证明是前列腺癌复发的高度预测因子。因此,研究人员假设原发肿瘤的基因组变异可以作为转移风险评估的指标。为了可靠地估计明显转移的潜在时间,风险评估模型理想地从转移前后纵向测序数据中学习潜在的肿瘤进展和转移模式。然而,目前可用的基因组数据库只有少量这样的配对样本,这不足以在更大的癌症人群中分类出可靠的预后生物标志物。另一方面,横断面原发和转移性肿瘤样本有大量的大规模临床DNA测序数据,可以缓解纵向数据的不足。例如,最近对乳腺癌和结肠直肠癌的MSK-IMPACT数据的分析发现了显著的预示治疗反应和患者生存的生物标志物。通过从这些未配对的样本中学习转移前后的基因组差异,计算模型可以通过寻找原发肿瘤基因组中的转移特征,自动评估其转移风险。因此,即使是来自不同患者的未配对样本数据,仍可能是描述克隆进化和癌症进展过程中肿瘤行为的宝贵资源。流行病学研究发现,根据来源组织和其他因素,转移瘤细胞倾向于在某些遥远的器官上播种,这被称为器官趋向性。例如,2010年至2015年的流行病学数据表明,大约80%的同步脑转移源自肺原发灶15。来自同一组织但在不同器官定植的转移可能导致不同的患者预后。例如,在大多数癌症类型中,与其他转移相比,肝炎转移通常导致明显较差的临床结果。
在这项工作中,研究人员的目标是通过收集和分析总共32176例胰腺癌DNA测序样本,开发一个转移网络模型来评估转移风险和潜在的目的器官。利用这一大数据队列,研究人员识别了与常见转移和有机质性转移相关的基因组生物标志物,并在早期阶段使用机器学习模型来筛选一个可区分的亚型,即原发性转移特征,验证其在转移风险评估中的效用。与传统原发性患者相比,无病生存期更短。从与肺癌脑转移相关的生物标志物中,研究人员发现了pi3k通路畸变的显著富集,并使用研究人员的药物基因组数据库验证了靶向MTOR在治疗肺癌脑转移中的有效性。利用嗜有机生物标志物,研究人员建立了一个计算模型,将原发性前列腺癌患者分层为具有骨转移倾向或肝转移倾向的亚组,以便在随访中进行器官特异性检查。为了便于转移风险评估和其他有机生物标志物的验证,研究人员开发了一个MetaNet的web应用程序,可以在https://wanglab.shinyapps.io/ MetaNet上获得。
为了全面描述转移性癌症的扩散模式,并提高识别潜在预后基因组生物标志物的统计能力,研究人员整合了来自4项研究的32176例原发性和转移性癌症样本的临床和基因组数据:来自MSKIMPACT (MSK)的10,946个样本,来自Foundation Medicine Inc. (FMI)的18,004个样本,来自密歇根大学(MET500)的500个转移性样本,以及来自癌症基因组图谱(TCGA)的3,336个肺癌、乳腺癌、结肠癌和前列腺癌的原始样本。研究人员将这些肿瘤样本的起源组织和采样位置划分为一般解剖器官位置,并将次要和不明确的组织从下游分析中排除。接下来,研究人员构建了一个泛癌转移的扩散图(图1a),起源于16个不同的原发部位,并向8个转移部位转移。除淋巴结作为局部转移部位外,排在第一位的远处转移器官是肝、骨、肺和脑,这些器官特异性转移都被深入研究。
为了研究常见的癌症扩散模式,研究人员基于16种原发癌症中转移部位分数分布的相似性构建了原发癌症网络(PCN,图1b)。通过网络聚类分析,研究人员确定了两类原发肿瘤,其中表现出相似转移方向偏好的原发肿瘤器官来自同一功能系统。其中一组是嗜肝性癌症,包括乳腺癌以及来自食道、胃、胆囊、胰腺和结肠等消化系统的所有癌症。另一组主要是嗜肺性,包括皮肤、甲状腺、肝脏、头颈部和泌尿系统(肾、膀胱和前列腺)的癌症。同样,研究人员根据8个转移部位接受的转移癌类型的相似性构建了一个转移部位网络(MSN),发现4个常见的转移器官,肝、肺、骨和脑,接受不同类型的原发癌。
为了研究介导这种复杂扩散模式的遗传因素以及潜在的临床影响,研究人员开发了MetaNet,这是一个计算框架,根据肿瘤的基因组谱和临床数据预测肿瘤是否会扩散以及在何处扩散(图1d)。总的来说,MetaNet包括两个模型:模型1通过学习原发肿瘤和转移瘤之间的基因组差异来预测原发肿瘤是否会转移,模型2通过捕获器官特异性转移瘤之间的基因组特征来预测原发肿瘤将在何处定殖(图1d)。通过基于模型的基因组谱对每个肿瘤的转移能力和器官特异性进行评分,研究人员进一步评估从原发性转移的预测准确性,并询问哪些相关的遗传因素有助于预测。最后,研究人员通过MetaNet将独立的原发性肿瘤队列划分为不同的风险组,通过预后分析验证了研究人员的模型。
为了识别与转移相关的基因组变异,研究人员比较了16种原发和转移期癌症中每种突变、拷贝数改变(CNA)、染色体臂改变和10种致癌途径畸变的比例。总的来说,转移灶中显著富集的变异比原发灶中富集的变异多(图2a, b),表明从原发灶进化而来的转移灶是一个选择性的过程,在这个过程中,肿瘤通过其他变异获得转移能力。值得注意的是,转移中最显著富集的变异包括转移性乳腺癌中ESR1(雌激素受体1)突变(FDR <1e6, z-test, Benjamini Hochberg (BH)校正)和AR(雄激素受体)突变和复制数扩增在转移性前列腺癌(FDR <1e6, z测试,BH校正)。先前的研究报道,ESR1突变在对激素治疗有耐药性的复发性乳腺癌中普遍可见。同样,AR变异也被证明是抗雄激素消耗治疗的分子机制。此外,研究人员还观察到转移瘤基因组中拷贝数和染色体臂改变数量增加(图2b),这与之前报道转移瘤基因组结构高度不稳定的研究一致。在这些重要的CNAs中,研究人员发现MYC扩增是两种不同癌症类型:转移性前列腺癌和胰腺癌的唯一变异,表明其在促进肿瘤转移中的共同作用。
考虑到原发和转移基因组图谱的差异(图2a、b),研究人员建立了MetaNet Model 1,这是一个基于xgboost的机器学习模块,采用梯度增强树模型,利用肿瘤基因组图谱将原发肿瘤患者分层为不同的转移风险组(图1d)。特别是,研究人员首先训练该模型,利用肿瘤的临床、组织学和基因组特征,从四种常见癌症类型(乳腺癌、肺癌、结肠癌和前列腺癌)的原发肿瘤中识别转移性肿瘤。了解原发肿瘤和转移性肿瘤之间的不同特征后,该模型就能够估计一个肿瘤转移的可能性,称为Metascore。使用交叉验证,研究人员表明,相对于基线模型训练的临床和组织学特征没有基因组数据,genomics-based模型可以准确地识别主要的转移性肿瘤在乳腺癌和前列腺癌(接受者操作特征曲线下面积,AUROC祝辞0.8),而不是肺癌和结肠癌(图2c)。这一结果表明,原发性和转移性乳腺和前列腺肿瘤的基因组不同,而肺癌和结肠癌的基因组相似,这与研究人员在基因组谱比较中的观察结果相似(图2b)。从进化的角度来看,这表明不同于肺癌和结肠癌,乳腺癌和前列腺癌可能遵循特定的进化模式,在这种模式下,只有能够抵抗激素治疗的新克隆才能在转移中茁壮成长。就临床意义而言,乳腺癌和前列腺癌患者的无病生存期通常比肺癌和结肠癌患者长28,在恒定突变率的假设下,乳腺癌和前列腺癌的转移比肺癌和结肠癌的转移有更长的时间进化和获得更多的变异。
为了进一步了解哪些基因组变异用于转移风险预测模型,研究人员使用SHapley Additive explance(SHAP)值,通过可视化基因对乳腺癌转移风险的贡献来理清基于树的模型(图2d)。SHAP值为正值表明基因组特征对转移风险有积极贡献,而负值代表对转移风险有消极影响。与研究人员对原发性和转移性乳腺癌的基因组比较一致, ESR1突变的平均SHAP值被发现是转移性乳腺癌的最预测性特征,其次是FGFR4突变、SOX2扩增、ERBB2突变和FGFR1突变(图2d)。ERBB2突变通过与ESR1突变不同的机制被发现与激素治疗的耐药性相关。相比之下,乳腺癌低转移风险的最高预测变量是DAXX、MCL和GATA3扩增。有趣的是,先前的一项研究发现,GATA3通过诱导靶向一组前转移调控因子的microRNA-29b表达,在乳腺癌转移中发挥抑制作用。
尽管基于基因组学的模型在区分转移性乳腺癌和原发性乳腺癌和前列腺癌方面分别获得了0.82和0.8的AUROC,但误分类率是不可忽视的。检查Metascore分布在真正的原色和转移性样本类别,研究人员表明,误分类率主要是由假阳性率高(图2 e)在乳腺癌和前列腺癌,这表明该模型高估了初级肿瘤转移的一个子集。这种被高估的原发肿瘤子集,即使被标记为原发肿瘤,也可能携带转移丰富的特征,这使得它们在基因上更类似于原发肿瘤以外的转移瘤。因此,基于Metascore截断值为0.5(图2e),研究人员将这一组原发肿瘤视为具有转移特征的原发肿瘤(MFP) (n = 382,图2f),将另一组原发肿瘤视为常规原发肿瘤(n = 1255,图2f)。为了说明MFP肿瘤是否确实具有转移丰富的特征,研究人员计算了MFP、CP和转移性(M)乳腺癌中最高预测变异的比例(图2d)。研究人员一致发现,与CP肿瘤相比,MFP肿瘤具有更多的转移富集特征,如ESR1和ERBB2突变(图2g)。相反,与CP肿瘤相比,MFP肿瘤携带更少的原始富集特征,如MCL1和GATA3扩增(图2g),这表明,在研究人员的Metascore定义的基因组规模上,更多的转移富集特征和更少的原发富集特征共同将MFP肿瘤从传统的原发转移转移到真正的转移(图2f)。
为了探索MFP肿瘤的生物学和临床意义,研究人员收集了TCGA乳腺癌队列(32,33,包括1079个原发性乳腺癌样本)的基因组、转录组学和临床数据。将来自TCGA样本的临床、组织学和基因组数据的相同特征输入训练模型,研究人员通过计算其Metascore来估计每个TCGA样本的转移风险。在训练阶段确定的顶级预测基因组特征(图2d)对每个TCGA样本的转移性风险估计贡献了类似的预测能力(图3a),突出了这些预测特征的鲁棒性,无论是否存在由批效应和其他协变量引起的变化。特别是7个携带ESR1突变的TCGA原发乳腺癌样本均被认为是MFP肿瘤,突出表明ESR1突变是一个显著的特征,可以为原发肿瘤患者提供高转移风险的早期预警信号,但其转移灶尚未检测到。事实上,ESR1突变已被用于通过液体活检监测激素治疗的耐药性,即测量癌症患者血液中的细胞游离DNA 。
为了了解具有转移特征的原发肿瘤的功能后果,研究人员随后研究了基因表达数据。由于不同受体定义的乳腺癌亚型表现出不同的表达模式,研究人员将TCGA乳腺癌样本分为4个经典亚型:luminal A、luminal B、her2+和基底样,然后比较每个亚型中MFP和CP肿瘤之间的转录组谱。值得注意的是,研究人员发现在MFP肿瘤中上调的基因在HER2富集型和基底样亚型的上皮间质转化(EMT)中显著富集,而下调的基因在细胞周期增殖相关功能中显著富集,如G2M检查点和E2F目标(图3b, c)。这种模式不是GSEA发现的另外两个hormonerelated亚型和乳腺癌一般。一项研究观察了EMT之间相同的反模式,通过调节细胞增殖是携带者表达mda - mb - 468,三阴性乳腺癌细胞系,这在一定程度上支持了研究人员的观察。为了验证MFP肿瘤是否具有较高的转移风险,研究人员比较了MFP组和CP组患者的临床结果。利用TCGA中可用的生存数据筛选样本,研究人员发现MFP肿瘤患者的无病生存期(DFS)明显短于CP肿瘤患者(图3d)。同样,MFP前列腺癌和MFP肺癌患者的临床结果更差,DFS更短,这共同表明MFP肿瘤比CP肿瘤更进行性。
为了验证研究人员对转移风险的基因组评估Metascore是疾病进展的独立预测因子,研究人员比较了每一种乳腺癌亚型中MFP肿瘤患者和CP肿瘤患者的DFS,发现四种亚型中MFP组的DFS均较差(图3e)。此外,研究人员使用多变量Cox回归综合评估乳腺癌亚型和meta - core定义的MFP/CP分层的预测能力。引人注目的是,MFP对CP的危害比为3.9(2.2 7.0,95%置信区间),显著高于1的基值,且与亚型无关(图3f)。尽管先前的研究表明,基底样乳腺癌的总体生存率明显低于激素阳性亚型,但是,与研究人员的基于基因组的分层相比,这些亚型对疾病进展的预测能力并不强(图3f)。总之,研究人员证明了研究人员的乳腺癌转移风险的基因组分层是非常强大的,并且独立于传统的基于激素的乳腺癌亚型。
为了探索癌症转移的扩散偏好,研究人员从MSK (n = 2919)和FMI (n = 4100)队列中收集了两个大规模且独立的转移癌数据集,以研究这种器官特异性转移(即转移性器官趋向性)是否是一种统计上稳健的表型。比较两个独立队列中16个起源组织的8个转移部位的转移癌的分数差异,研究人员发现了一个显著的相关性(图4a)。最相关的转移癌类型是胰腺癌的肝转移(180例MSK患者中有143例转移,329例FMI患者中有263例转移)。总的来说,16种癌症中有15种(前列腺癌除外)在MSK组和FMI组之间表现出转移部位分布的显著相关性(图 4a),研究人员从大数据的角度得出结论,在大多数转移性癌症的传播方向是强有机性的,统计上是可靠的,这意味着有机性转移是高度非随机的,部分由某些潜在因素驱动,包括起源组织、血管模式、遗传背景和适宜的微环境。
为了进一步明确每种癌症类型中哪个器官是主要的转移目的地,研究人员通过将归一化部分投射到一个四面体空间(图4b),比较了四个常见的远处转移器官:骨、脑、肝和肺的癌症样本的分数。有趣的是,研究人员发现了两种癌症:一种是肝型,另一种是肺型,这与原发肿瘤网络的发现一致(图1b)。嗜肝组包括消化系统的五种癌症(胆囊、胰腺、胃、结肠和食道),这部分是由于血管结构和解剖学上的接近。嗜肺型包括头颈癌、甲状腺癌、子宫癌、皮肤癌、肾癌等,大部分位于肺附近。这两组研究的确解释了原发肿瘤网络中的簇形成(图1b)是由于肝脏和肺中主要的单器官倾向。此外,研究人员观察到广泛报道的器官向性,包括前列腺癌骨转移和肺癌脑转移。其他类型的癌症包括膀胱癌、卵巢癌和肝癌,并没有位于任何单一的角落,这表明它们的转移性器官取向并不是由单个器官主导的。
考虑到转移性嗜器官性是一种稳定的生物学现象(图4a),研究人员进一步研究其潜在的临床价值,即不同器官的转移是否影响患者的生存。使用总生存期(OS)数据在MSK的人群中,研究人员比较了操作系统差异的四种常见的四种常见癌症扩散转移器官根据卡普兰Meier阴谋下的面积的度量(同样是意味着生存)而不是生存不能计算中值长期存在癌症,比如前列腺癌。一般而言,在所有四种癌症类型中,转移性前列腺癌患者的生存期明显短于原发癌患者(图4c)。特别是,转移性前列腺癌患者在肝脏的生存期明显差于在骨骼的生存期(图4c),这表明预测潜在的转移部位可以为前列腺癌患者提供预后价值。出乎意料的是,脑转移并不总是意味着比其他转移的生存期更差:在乳腺癌和结肠癌中,脑转移的生存期比肝转移的生存期更差,而在转移性肺癌中,这种观察结果正好相反(图4c)。
接下来,研究人员研究遗传变异是否有助于转移性器官嗜性。考虑到大量的拷贝数和染色体臂改变在转移性癌症中显著富集(图2b),研究人员进一步研究这些改变是均匀分布于所有转移部位,还是在某一转移部位特异性富集。使用基因组改变(FGA)估计的分数MSK-IMPACT study,研究人员发现大幅增加脑转移的FGA相比non-brain转移和10的16的主要肿瘤癌症类型(图4d),特别是在肺癌、乳腺癌、结肠癌(图4 d),这些都是脑转移的首要来源。先前的研究表明,以高FGA为特征的染色体不稳定性是通过细胞质DNA反应发生转移的驱动因素。最近的一项研究发现,特别是在使用患者源性异种移植小鼠模型的肺癌脑转移中需要MYC扩增,这启发研究人员从基因角度进一步表征每个器官特异性转移。
为了在研究人员精心策划的大规模数据集中全面识别与转移性器官趋向性相关的变异,研究人员选择了位于骨、脑、肝和肺的转移样本,并筛选了在四个转移部位的分数显著偏离转移瘤平均分数的变异。使用假发现率控制,研究人员共鉴定了93个嗜器官趋向性变异型和特征,在某些转移位点的分数偏倚显著偏离平均值,其中大多数发现于源自结肠(n = 19)、乳腺(n = 15)和肺部(n = 13)的转移癌。几乎三分之二的器官趋向性变异型(93个中的59个)在脑转移中有一定程度的富集,而只有6个变异在肺转移中富集,5个在肝转移中富集。在这59个嗜脑性变异体中,有15个是CNAs,这表明这些改变的基因可能是脑转移中丰富的CNAs的关键因素(图4d)。
通过15个器官趋向性变异型在乳腺癌中,10个最丰富的脑转移,在肝转移,3和2在骨转移。每个变体的organspecific浓缩形象化,研究人员计算的优势比变体部分在一个转移性网站,网站,称为有机优势比(OGTOR),并将归一化OGTOR投影成一个四面体,四个角代表四个转移位点。未发现任何变异位于肺转移角附近,而肺转移中最丰富的变异和特征,如p53、Ras和Myc通路(67%、56%和20%),在脑转移中更为丰富(80%、73%和37%)。OGTORs投射到三角空间(图5),而不是和变体分数大于5%,突显出变异罗斯福小于0.05,研究人员清楚地表明,liver-tropic变体的乳腺癌是ESR1突变,bone-tropic变体是携带者突变,和brain-tropic变异包括TP53突变,CDK12,和ERBB2放大。特别是,ESR1突变极大地改变了转移性乳腺癌终点的分布,肝脏的转移率急剧上升(从52%上升到75%),同时脑和肺的转移率也有所下降(图5b)。进一步检查乳腺癌样本中每个ESR1突变,研究人员发现肝脏转移浓缩实际上是主要由四个热点位置位于配体结合域:D538, Y537, L538 E380 (图5c),所有这些在空间上彼此接近,并已被证明可以引起雌激素独立的下游信号通路激活,促进细胞增殖。CDH1突变在骨转移中富集,被认为是侵袭性小叶癌中一种功能缺失突变,导致细胞与细胞粘附的失调,具有松散的表型。事实上,TP53突变和ERBB2扩增在三阴性乳腺癌和her2富集乳腺癌中分别富集。之前的一项流行病学研究表明,除基底样亚型外,乳腺癌骨转移在所有亚型中都很常见,而肝转移在激素阳性亚型中富集,脑转移在her2富集和三阴性亚型中富集。所有这些都与研究人员的器官趋向性变异型富集分析高度一致。
在肺癌的13个器官趋向性变异型中,10个在脑转移中最为丰富,3个在骨转移中最为丰富(补充资料3)。由于样本数量少(n = 32),且缺少关于区域复发或从肺一个部位到另一个部位的远处转移的注释,因此研究人员排除了肺转移。在脑转移中发现了显著高的突变负担(大于20个突变/兆碱基),以CREBBP和EPHA5突变富集为特征(图5d)。STK11突变在骨转移中显著富集,其参与的PI3K通路的畸变显著增加了脑转移的比例(图5e)。有趣的是,尽管STK11突变在骨转移中更丰富,但在伴有PI3K通路畸变的肺癌脑转移样本中,STK11突变是最丰富的变异。前期研究表明,STK11是一种抑癌因子,其功能缺失突变参与了腺癌向鳞癌的形态改变,进而促进肺癌转移。通过分析研究人员之前的药物基因组数据集,从462个患者源性细胞株(PDCs)中筛选了60种抗癌药物,研究人员发现,对于23个肺癌脑转移(LUBM)患者源性细胞株(PDCs), 5种pi3k通路抑制剂位列7种最有效药物之列。五种PI3K通路抑制剂中有三种(gedatolisib、依维莫司和vistusertib)靶向于PI3K通路的下游效应子MTOR51。进一步比较23个LUBM PDCs和其他439个PDCs的药物疗效,发现三种MTOR抑制剂具有显著的高特异性(图5f)。总的来说,这一结果证实了异常激活的PI3K通路的富集及其在肺癌脑转移中的临床作用。
在结肠癌的19个器官性变异中,脑转移中有11个最丰富,骨转移中有7个最丰富,肝转移中有1个最丰富。肺转移中未发现明显的变异。除了肝脏转移中富集的TGF-β通路畸变,以SMAD4突变和缺失为特征,其他显著的变异主要是位于13q染色体的扩增,以及以KRAS突变为特征的Ras通路激活(图5g)。在这些嗜脑性扩增中,最显著的是CDK8扩增,它使脑转移率从2%小幅增加到11% (图5h)。尽管CDK8与其染色体邻居FLT1和FLT3一起被扩增,但研究人员从TCGA52中收集了转录组数据,表明只有CDK8的扩增,而不是FLT1和FLT3的扩增,通过相应的表达上调具有功能。先前的研究已经证明了CDK8在结肠癌细胞增殖中的致癌作用,作为WNT通路中β- catenin驱动转化的正向中介。在最近的两项研究中,使用来自同一患者的原发结肠癌和脑转移结肠癌成对样本,研究人员证明了CDK8扩增在脑转移中不是新出现的事件,而是从原发肿瘤中遗传而来的。比较CDK8扩增的原发性结肠癌TCGA和非扩增病例的转录组谱,研究人员发现CDK8扩增实际上与促进上皮间充质转化有关和细胞增殖下调,提示CDK8扩增在结肠癌远处转移中的作用。此外,研究人员利用TCGA的临床数据表明,CDK8扩增的结肠癌患者诊断出的淋巴结扩散更多, DFS显著缩短(图5i)。总的来说,所有的证据都明确指出,带有CDK8扩增的结肠癌更具进行性,有很强的向大脑远处迁移的潜力。鉴于结肠癌转移遵循一个连续的级联从结肠、肝、肺,研究人员推断脑转移的结肠癌也遵循这个级联由血液从肺部血管,迁移到心脏,最终通过颈动脉进入大脑。原发、肝、肺和脑转移中的CDK8扩增部分呈显著增加趋势(图6g),提示级联过程中CDK8扩增阳性选择。
尽管研究人员只识别了一种有机性变异,即前列腺癌肺转移中的MSH6突变,但研究人员从生存分析中观察到(图4c),原发性前列腺癌骨转移患者,在40个月的随访中,肝转移患者的平均生存时间分别减少了33个月、24个月和13个月(图4c和6a)。这三组之间的两两比较都产生了显著的差异(图6a),与以往的流行病学统计数据一致。受到这一事实的启发,研究人员开发了MetaNet模型2(图1d),这是一个基于器官嗜性的预后系统,根据转移目的地的倾向将患者分层为不同的风险组。使用序回归模型框架,研究人员使用MSK和FMI前列腺癌队列的联合数据集对MetaNet预后模块进行训练(图6b),在三级预测任务中获得了64.3%的准确率。接下来,研究人员应用MetaNet模块独立的预后主要从TCGA55前列腺癌患者,并分层分为三组(图6 b)风险:传统初级(CP, n = 237),骨初级转移性主特征(BoneMFP, n = 174)、和肝转移性主特征(LiverMFP, n = 83)。引人注目的是,这三个风险DFS组有类似的下降趋势,和两两比较三组之间的DFS产量显著差异:在CP和Bone-MFP, Bone-MFP vs Liver-MFP,和 CP和Liver-MFP(图6 c)。这提示嗜器官性分层可以提示临床医生在高危患者随访期间进行器官特异性检查。
为了展示研究人员基于基因组学的分层模型的机制,研究人员展示了预测变异在每个分层组中的对应部分(图6d)。总的来说,在每个危险组中,这些预测变异的比例从CP到骨和肝MFP组都呈现增加的趋势,其特征是细胞周期、p53和PI3K通路的畸变,表明恶性肿瘤的顺序过程与生存模式一致(图6c)。特别是,研究人员注意到FGA超过5%是CP的高分辨特性(31%)和骨-(88%)和liver-MFP(99%)患者,连同两个特色CNAs: CDKN1B删除和基于“增大化现实”技术的放大(图6 d),这与先前的研究一致仅仅使用FGA预测cancer前列腺癌患者的生存。骨性mfp组较肝脏mfp组的预测变异为SPOP突变,且显著丰富,已发现代表不同的前列腺癌亚型互斥的常见E26转换(ETS)转录家庭fusions。CDK12突变,尽管在所有三组中比例都很低(CP为0%,骨MFP为2.8%,肝MFP为5.9%),也已被证明增加了前列腺癌的基因组不稳定性和侵袭性。
目前标准的前列腺癌分级体系主要依赖于基于两处病变组织学图像形态学特征的Gleason评分。研究人员将基于基因组的有机生物分层与TCGA队列中的Gleason分级进行了比较,发现在每个Gleason分级中,研究人员的基因组分层的中位数分数严格递增,表明利用基因组学和组织学分析,两个独立系统之间具有高度的一致性(图6e)。特别是,研究人员的基于基因组学的系统将更多的CP患者划分为低gleason分级组,更多的肝脏MFP患者划分为高gleason分级组。这表明整合转移性前列腺癌的基因组图谱来分层原发性前列腺癌患者的转移风险可以为更精确的诊断和预后提供额外的维度。
Jiang, B., Mu, Q., Qiu, F. et al. Machine learning of genomic features in organotropic metastases stratifies progression risk of primary tumors. Nat Commun 12, 6692 (2021). https://doi.org/10.1038/s41467-021-27017-w