当油腻的“Meta”碰上纯洁的“生信”,会擦出什么样的火花?
哈喽,大家好,今天为大家分享一篇发表在Molecular Therapy - Nucleic Acids杂志(IF:7.032)上的文章“A Chemoresistance lncRNA Signature for Recurrence Risk Stratification of Colon Cancer Patients with Chemotherapy”,本文中作者构建了化疗耐药性lncRNA的特征CRLSig预测模型。乍看题目,小编并不觉得其有什么奇特之处,但精读之后,才发现妙不可言啊~,当油腻的“Meta”碰上纯洁的“生信”,尤其是作者还使用了一种新型的蛋白质分析工具“Protemaps”,瞬间为文章增色不少,好奇的小伙伴和小编一起来学习下吧~
数据来源:
TCGA:https://portal.gdc.cancer.gov
GEO:http://www.ncbi.nlm.nih
筛选标准:
1)含有总体/无复发生存数据;
2)含有化疗及其他疗法信息;
3)样本量超过50名患者;
4)有临床数据,如AJCCTNM分期、年龄和性别。
研究对象:
★共纳入了1171名结肠癌患者(未接受化疗715名,接受化疗456名)。
★接受化疗的患者作为训练队列(GSE103479(n=60)、GSE39582(n=240)和GSE72970(n=83))。
★TCGA_COAD队列中71名仅接受化疗的患者作为外部验证队列。
★未接受化疗的患者作为对照组GSE103479(n=70)、GSE39582(n=326)和TCGA_COAD(n=319)。
★SMC队列(GSE132465)单细胞测序数据的65362个细胞。scRNA-seq数据中上皮细胞的CMS亚型也来自SMC队列。
患者基线资料:
流程图
结果展示
1.通过Meta-分析鉴定结肠癌患者中化疗相关的lncRNA
使用GENCODE v25和RefSeq v79进行注释,从GSE103479、GSE39582和GSE72970中共获得了2456个独特的lncRNA。然后,进行Cox比例风险回归分析,检测2456个lncRNA的RFS-相关风险比(HR,95%CI),根据患者的TNM分期进行调整。为了获得在接受化疗患者中与RFS相关的lncRNA,使用Meta-分析固定效应模型汇总2456个lncRNA的HR,结果发现,177个lncRNAs在未化疗患者中与RFS显著相关,268个lncRNAs在化疗患者中与RFS显著相关(图2A)。其中,在接受化疗的结肠癌患者中,有55种lncRNAs被识别为稳定的化疗耐药lncRNAs(meta-HR>1,P<0.00)。这55个lncRNAs与化疗患者显正相关(图2B)。化疗相关lncRNA的预后值和β系数均显示在图2C和补充表S3中。
2.CRLSig的构建和验证
为了更好地区分化疗耐药人群,选择在化疗患者中发现的预后显著较差的lncRNA构建了名为CRLSig的化学抗性lncRNAs特征,如
其中i和j代表化疗相关lncRNA的序列和总数,βi是相应lncRNA的系数,expi是相应队列中lncRNA的标准化表达。
预后分析显示,化疗组结肠癌患者的RFS可通过CRLSig在这些队列中显著区分(图3A-3C)。此外,在验证集中,可以观察到高CRLSig组和低CRLSig组之间的显著差异(图3D)。研究证明CRLSig可以区分高组和低组,即使患者接受了标准的辅助化疗,该工具可仍用于识别接受化疗的预后较好的患者或RFS高风险的患者。ROC分析显示CRLSig预测结肠癌预后的AUC分别为GSE39582(0.58-0.65)、GSE72790(0.73-0.75)、GSE103479(0.46-0.65)和TCGA_COAD(0.71-0.83)(图3E-3H)。复发状态随CRLSig增加的直方图也显示了相同的趋势(图3I-3L)。
3.结肠癌化疗患者CRLSig亚组分析
进一步测试了GSE39582、GSE72970和TCGA_COAD队列中不同TNM分期的CRLSig预后值(GSE103479的患者均为II+III期,无IV期),以评估CRLSig的准确性和有效性,尽管已经构建了基于TNM调整后的CRLSig,结果发现在训练队列(GSE72970和GSE39582)和验证队列(TCGA_COAD)(图4A-4F)中,II+III期或IV期患者的高和低CRLSig组的RFS仍存在显著差异。
4.CRLSig对化疗治疗反应的预测
考虑到55个lncRNAs可能会降低化疗的有效性,作者验证了CRLSig对TCGA队列(n=71)患者化疗反应的预测值。条形图显示CRLSig评分随着SD/PD的增加而增加(图5A)。直方图的卡方检验还发现CRLSig与化疗反应之间存在显著关联(图5B)。SD/PD状态化疗患者的CRLSig评分高于PR/CR状态患者(图5C)。ROC分析显示,使用95%CI的CRLSig预测PR/CR的AUC为0.731(0.554-0.878)(图5D)。
5.TCGA_COAD中低和高CRLSig之间的通路富集分析
在这里,作者采用了一种新的蛋白质定量数据分析工具“protemaps”,该工具能够展示蛋白质的定量组成,重点是蛋白质的丰度和功能。在蛋白质图谱中,每个蛋白质都显示为一个多边形,功能相关的蛋白质出现在相邻区域,区域大小代表蛋白质丰度高低。
根据KEGG通路分析显示,对化疗有反应患者的代谢基因比例高于无反应患者(图5E-5F)。此外,低CRLSig患者一部分代谢基因与对化疗有反应的患者相似(图5G-5H)。因此,在反应组或低CRLSig组中,较高水平的代谢RNA占主导地位。
为了观察这些患者的代谢特征,作者进一步收集了先前研究的113条代谢途径,并在本研究中对接受化疗的TCGA_COAD患者进行了GSVA分析(基因集变异分析)。通过比较化疗患者的高/低CRLSig组或CR、PR/PD、SD组,发现PR/CR患者和低CRLSig患者分别有27和25条代谢途径被激活。其中,尿素循环、丙酮酸代谢和硫辛酸代谢等17条代谢途径在PR/CR和低CRLSig组中均被激活(图5I和图5J)。
6.CRLSig与其他临床病理因素的独立性及其临床特征
为了确定CRLSig的预后价值是否独立于训练和验证队列中的其他临床病理因素,作者使用单变量Cox回归分析来测试CRLSig的性能(补充表S7)。同时进行了多变量Cox回归分析,结果显示CRLSig在训练队列和验证队列中均与RFS显著相关(图6A)。作者还测试了TCGA队列中CRLSig与其他临床病理因素之间的关系。除了OS和RFS,CRLSig还与结肠癌化疗患者的TNM分期显著相关(图6B)。在TCGA验证队列CRLSig与OS显著相关(图6C)。
为验证CRLSig在其他接受化疗的癌症患者中的应用价值,作者对接受化疗的18种癌症患者进行CRLSig的Cox回归分析,发现在PAAD和STAD队列中,采用CRLSig评分可以将患者分为两组,预后显著不同(补充图S6A-S6C)。
7.CRLSig的微环境特征
在TCGA队列中,作者通过xCellR包获得了大量接受化疗的结肠癌患者的免疫浸润细胞。结果发现,自然杀伤T(NKT)细胞与CRLSig显著相关。其他免疫细胞,包括巨噬细胞、CD8+幼稚T细胞、CD8+T细胞和CD8+Tcm,与CRLSig呈负相关(图6D)。一些趋化因子和细胞因子受体基因,如CSF2RB、CXCL14和CXCL9,也与CRLSig呈负相关(图6E)。
此外,作者在GSE132465的单细胞测序数据中计算了65362个细胞中的CRLSig,发现与其他细胞相比,基质细胞中的CRLSig值更高(图6F-6G)。共识分子分型(CMS)为结直肠癌提供了生物学上合理的分层。为了在单细胞水平上探索CRLSig与CMS亚型之间的关系,作者使用之前的scRNAseq数据发现,CMS1和CMS4亚型在肿瘤上皮细胞中比其他CMS亚型具有更高的CRLSig(图6H)。
结语
结肠癌是胃肠道最常见的恶性肿瘤之一,结肠切除术与辅助化疗和放疗相结合,被公认为结肠癌的标准治疗方法。虽然化疗是有益的,但结果差异很大。此外,还没有开发出有效的临床预测因子来确定哪些结肠癌患者将从化疗中受益,这也表明适当的患者分层的重要性。在本文中,作者提出了一种基于长链非编码 RNA (lncRNA) 的结肠癌患者化疗预测模型,从而期望能够提供更好的患者分层,进而实现更有效的个性化化疗。所以说呢,虽然分析的方法和套路都大同小异,但是作者的研究还是具有一定的临床意义的,作者还结合了meta分析和生信分析两种大数据分析工具,在经典的基础上进行创新,不就是我们应该追求的吗?
参考文献:
Hao Wang, Yuzhen Gao, Somayeh Vafaei, Qiaoyan Yu, Jun Zhang, Liangjing Wang,A Chemoresistance lncRNA Signature for Recurrence Risk Stratification of Colon Cancer Patients with Chemotherapy,Molecular Therapy - Nucleic Acids,2021,ISSN 2162-2531,https://doi.org/10.1016/j.omtn.2021.12.015.