DLEU2L/TAOK1轴作为肝癌预后标志物的综合分析
这篇文章发表在期刊: Molecular Therapy-nucleic Acids,该期刊文章在2021影响因子: 8.886比去年增长了1.854。在中科院大类: 医学 2区。中科院小类: 2区 医学:研究与实验。笔者认为该篇文章为ceRNA相关的纯生信分析文章,逻辑思维和作图质量高,值得我们学习。
发现问题:
越来越多的证据强调了竞争性内源性RNA(ceRNA)调控网络在各种人类癌症中的关键作用。然而,肝细胞癌中ceRNA网络的复杂性和行为特征仍不清楚。
背景知识:
肝细胞癌(HCC)是危害人类健康的最致命的恶性肿瘤之一。越来越多的证据强调了竞争性内源性RNA(ceRNA)调控网络在各种人类癌症中的关键作用。然而,肝细胞癌中ceRNA网络的复杂性和行为特征仍不清楚。
结果:
作者在这里先给读者提供一张流程图(Figure 1),使本文的思路清晰明了。首先,通过对371例肝癌样本中PTEN高表达和低表达两组(PTENhigh 和 PTENlow)进行差异表达分析,再利用差异表达RNA构建了肝癌相关的lncRNA-miRNA-mRNA三重调控网络。功能富集分析评估了该网络在肝癌中的功能作用和潜在机制。然后,通过对三重调控网络的RNA进行表达分析、生存分析和核质定位分析,确定了一个关键的ceRNA网络。此外,作者还对这多个预测基因与PTEN进行了相关性分析,结果表明DLEU2L/TAOK1轴在肝癌中起着重要作用。最后进行Cox回归分析,得出TAOK1在肝癌中的诊断和预后价值。利用基因本体论(GO)和京都基因与基因组百科全书(KEGG)分析TAOK1在肝癌中的可能功能(见附图),并通过甲基化分析和免疫浸润分析进一步研究TAOK1在肝癌中的潜在生物学功能。
Figure 1. Flowchart of construction and analysis of ceRNA
作者为了探讨PTEN在肝癌中的可能作用,使用人类蛋白质图谱(Human Protein Atlas,HPA)数据库,发现了PTEN在正常肝组织中高表达,而在肝癌组织中低表达(Figures 2A)。HPA的免疫组化(IHC)染色也证实了PTEN表达有相似的调节(Figure 2B)。鉴于PTEN在肿瘤样本中的异常低表达,作者随后研究了PTEN在肝癌患者中的表达的临床意义。根据Kaplan-Meier生存曲线,如Figure 2C所示,作者的数据表明PTEN的低表达与HCC队列患者的总体生存率(OS)低呈显著相关。此外,为了了解PTEN在肝癌中异常低表达的可能机制,作者分析了PTEN的基因组和拷贝数。OncoPrint图显示了TCGA HCC数据集中PTEN基因的缺失(图2D)。超过三分之一的肝癌样本含有PTEN缺失,而且,PTEN缺失的肝细胞癌组织的mRNA表达低于二倍体PTEN的肝癌组织(Figure 2E)。肝癌组织中PTEN拷贝数与mRNA表达呈正相关(Figure 2F)。综上所述,这些数据表明PTEN在HCC中的表达下调,PTEN拷贝数的缺失可能是肝癌患者PTEN表达下调的主要机制之一。
Figure 2. The tumor suppressor role of PTEN in human hepatocellular carcinoma (HCC)
根据以上分析,与PTEN相关的ceRNA网络可以作为预测肝癌患者预后的潜在模型。另外,作者还必须知道PTENhigh 和 PTENlow在癌组织和癌旁组织的表达水平是相反的意义何在。作者首先利用TCGA数据库,以p<0.05和|log fold changeFC| >0.5为lncRNA阈值,p<0.05和|logFC|>0.3为miRNA阈值,p<0.05和|logFC|>0.7/0.5为mRNA阈值,鉴定出PTENhigh 和 PTENlow在肝癌和癌旁正常组织中的DElncRNAs、DEmiRNAs和DEmRNAs。在肝癌样本PTENhigh 和 PTENlow 组中,共筛选出860个DElncRNAs(137个上调和723个下调)、54个DEmiRNAs(21个上调和33个下调)和1,871个DEmRNAs(195个上调和1676个下调)。此外,在HCC和正常肝组织中共检测到3371个DElncRNAs(3041个上调和330个下调),420个DEmiRNAs(102个上调和318个下调)和8294个DEmRNAs(7059个上调和1235个下调)。作者用火山图直观地显示DElncRNAs、DEmiRNAs和DEmRNAs。(Figures 3A–3C),作者还利用热图显示了在PTENhigh 和 PTENlow的肝癌组织中以及在肝癌和正常组织中的重要的可变区基因(Figures 3D–3F)。
Figure 3. Volcano plots and heatmap plots of DElncRNAs, DEmiRNAs, and DEmRNAs between the expression of PTENhigh and PTENlow in HCC samples
为了建立肝癌组织中的lncRNA-miRNA-mRNA三重调控网络,作者在PTENhigh 和 PTENlow组以及HCC和正常肝组织组中进行了联合分析。首先,作者将DElncRNAs放入TarBase数据库中,以确定针对lncRNAs的潜在miRNAs。在与54个DEmiRNAs相交后,从预测的miRNAs中选择了4个。然后,作者使用miRDB和TargetScan的数据库,参照4个DEmiRNAs来识别下游的靶mRNA。此外,作者寻找两个数据库共有的候选mRNA,这么做的目的是提高预测的准确性。结果表明,在8294个DEmRNA中鉴定出373个。最后,利用Cytoscape软件,把5个lncRNA(4个上调和1个下调)、4个miRNAs(1个上调和3个下调)和372个mRNAs(326个上调和46个下调)做成了肝癌相关的lncRNA-miRNAmRNA三重调控网络(Figure 4A). 作者又利用Cytoscape插件Cell Hubba确定中枢三重调控网络。结果表明,共鉴定出3个lncRNA(DLEU2L、FAM99A和ARRDC1-AS1),4个miRNAs(miR-99a5p、miR-100-5p、miR-9-5p和miR-125b-5p)和6个mRNA(TAOK1、HS3ST3B1、RHOQ、AGO2、BAZ2A和NR6A1) (Figure 4B)。 作者通过Metascape的功能富集分析(包括GO和KEGG)进一步探索与三重调控网络相关的潜在功能。(Figure 4C).
Figure 4. Construction and functional enrichment analysis of the lnRNA-miRNA-mRNA triple regulatory network
为了建立一个在HCC中具有重要预后价值的重要ceRNA,作者首先分析了PTENhigh 和 PTENlow的HCC样本以及HCC和邻近正常肝组织中三重调控网络中RNA的表达水平。作者的结果显示一共有一个下调的(DLEU2L)和两个未分化的(ARRDC1AS1和FAM99A)lncRNA,一个上调的(miR-9-5p)和三个下调的(miR-99a-5p,miR-100-5p和miR-125b5p)miRNAs,三个下调的(TAOK1,HS3ST3B1和AGO2)和三个未分化的(RHOQ,BAZQ) (Figure 5A) 作者还发现了两个上调的(DLEU2L和ARRDC1-AS1)和一个下调的(FAM99A)lncRNA,一个上调的(miR-9-5p)和三个下调的(miR-99a5p、miR-100-5p和miR-125b-5p)miRNAs,以及五个上调的(TAOK1、RHOQ、AGO2、BAZ2A和NR6A1)mRNAs(Figure 5B)。然后,为了确定这些RNA是否与HCC预后相关,作者使用Kaplan-Meier分析和log-rank检验对HCC患者进行OS分析。总之,发现1个DElncRNA(DLEU2L)、2个DEmiRNAs(miR-99a-5p和miR-100-5p)和3个DEmRNAs(TAOK1、HS3ST3B1和RHOQ)与预后有关(p<0.05)(Figure 6)。考虑到lncRNAs的细胞定位决定了潜在的机制,作者通过lncLocator分析了这三个DElncRNAs的亚细胞定位。如Figure 7A所示,DLEU2L主要分布在细胞质中,而另外两个LncRNAs(FAM99A和ARRDC1-AS1)主要分布在胞质溶胶中。这些数据表明,DLEU2L可能通过海绵miR-99a-5p/miR-100-5p作为ceRNA促进TAOK1的表达(Figure 7B) 。TarBase和TargetScan预测DLEU2L和TAOK130UTR中的目标位点分别与miR-99a-5p和miR-100-5p (Figure 7C) 相关。此外,表达相关性分析表明,DLEU2L的表达与TAOK1的表达呈正相关(Figure 7D) 。因此,ceRNA网络中的DLEU2L/TAOK1轴被选作下一步分析的潜在预测模型。
Figure 5. The distribution of 13 hub-RNA expression patterns from the triple regulatory network in TCGA HCC dataset
Figure 6. Overall survival analysis for the RNAs in the hub triple regulatory network
Figure 7. Construction and correlation analysis of the ceRNA network
为了确定DLEU2L和TAOK1的表达水平是否受临床特征的影响,作者探讨了DLEU2L和TAOK1的表达与临床因素的相关性。作者进行了单变量和多变量Cox回归分析,以确定OS相关特征。在DLEU2L和TAOK1的单因素Cox回归模型中,TCGA队列中肝癌患者的某些预后因素(TNM分期、肿瘤直径、淋巴结转移和远处转移)与OS密切相关。DLEU2L(风险比[HR]=1.572,p=0.011)和TAOK1(HR=1.537,p=0.016)过表达均与较差的预后显著相关。然而,对DLEU2L的多因素Cox回归分析显示,DLEU2L的高表达与预后不良无关(HR=1.369,p=0.078)。因此,TAOK1可能成为肝癌患者的独立预后因子。
为了更好地理解DLEU2L/TAOK1轴在肝癌中的作用,作者接下来详细分析了TAOK1。首先,作者使用在线工具Cancer Cell Line Encyclopedia (CCLE) 并发现TAOK1在肝癌细胞系中高表达。此外,作者还对GEO数据库中的GSE41804肝癌队列中的20对肝癌样本进行了TAOK1的差异分析,以进一步验证TAOK1的表达。结果表明,TAOK1在肝癌组织中的表达明显高于配对的非肿瘤性肝组织,这与作者从TCGA数据中得到的结果是一致的(Figures 5A and 6)。
作者为了进一步阐明TAOK1在肝癌组织中的异常上调机制,还用多种方法探讨TAOK1的表达水平与其甲基化状态的相关性。首先,对肝癌TAOK1high 和 TAOK1low组三种DNA甲基转移酶(DNMT1、DNMT3a和Dnmt3b)进行差异表达分析,结果表明TAOK1high组DNMT1、DNMT3a和Dnmt3b的表达明显高于TAOK1low组(Figure 8A)。其次, UALCAN分析表明,DNMT1在正常肝组织中的甲基化水平高于在肝癌组织中的甲基化水平(p = 0.101, Figure 8B)。并且DiseaseMeth 2.0版分析表明,与肝癌组织相比,癌旁正常组织中TAOK1的甲基化水平显著升高(p < 0.0001; Figure 8C) 。此外,作者在TAOK1的DNA序列中发现了两个甲基化位点(cg16008158和cg2570978),它们与其表达水平呈负相关(Figure 8D)
Figure 8. Methylation analysis of TAOK1
在一些肿瘤中,肿瘤浸润性淋巴细胞(TIL)是前哨淋巴结(SLN)状态和生存期的独立预测因子。作者接下来使用TIMER研究肝癌组织中TAOK1表达与免疫浸润水平的关系(也是热点之一),首先,“SCNA”模块分析显示,肝癌中几种免疫细胞浸润水平似乎与TAOK1基因拷贝数改变有关,包括B细胞、CD4+T细胞、巨噬细胞和树突状细胞(DC)(Figure 9A) 。“Gene”模块分析显示,TAOK1的表达与肿瘤纯度无显著相关性,但与肝癌组织中CD4+T细胞、巨噬细胞、中性粒细胞和树突状细胞的浸润水平呈显著正相关(Figure 9B)。最后,作者进一步评估了免疫浸润对肝癌患者临床预后的影响。结果表明,生存期小于24个月的肝癌患者,CD4+细胞、巨噬细胞和中性粒细胞水平高与预后不良有关(Figure 9C)。提示DLEU2L/TAOK1轴可能通过调节肿瘤浸润性免疫细胞水平而影响HCC和临床预后。
Figure 9. Correlation analysis of TAOK1 expression and immune infifiltration in HCC
本文小结:
作者建立了一个与肝癌预后相关的ceRNA(DLEU2L-hsa-miR-100-5p/hsa-miR-99a-5p-TAOK1)过表达网络,更好地了解了lncRNA-miRNA-mRNA之间的相关性。此外,作者还发现基于ceRNA的DLEU2L/TAOK1轴可能是参与HCC的一个新的重要预后因子,该预后模型有助于探讨HCC的发病机制。