大家好!今天给大家分享的文献是2021年11月发表在Frontiers in Oncology(IF 6.244)上的一篇纯生信分析文章,全篇数据来源于公共数据库,不涉及湿实验。成本低,周期短(抓重点),一起来学习下吧。
识别头颈部鳞状细胞癌中神经-癌cross-talk相关基因预后模型
学习文章之前,先了解一下基础知识:
HNSC: Head and Neck Squamous cell Carcinoma 头颈部鳞状细胞癌
NCCGs : Nerve-Cancer Cross-talk-related Genes 神经-癌cross-talk相关基因
nerve-cancer cross talk:神经在肿瘤的发生发展中起着重要作用。神经释放的乙酰胆碱等神经递质可以激活癌细胞、基质细胞和免疫细胞的膜受体,并且癌细胞分泌的神经营养因子也会促进神经生长。这一现象称为Nerve-Cancer Cross-talk。
数据来源和分析方法
数据来源
本文所使用数据全部来自TCGA和GEO公共数据库,非常简单方便易获取。
TCGA获取 501例HNSC的RNA-seq数据及临床信息。GSE41613 获取97例HNSC患者的RNA-seq数据和临床信息。GSE103322 获取HNSC的scRNA-seq数据。GBE52130, GSE38616获取 14个口腔扁平苔藓上皮和14个正常口腔上皮的基因表达数据。
分析方法
本篇文章分析方法主要分为以下几个部分:
首先是42个NCCGs的概况描述,对42个NCCGs有一个landscape式的上帝视角全局全貌的认识。包括(1)突变分析,使用cBioPortal实现突变分析。(2)蛋白互作,使用String数据库对42个NCCG进行了蛋白互作分析。(3)功能富集分析,使用R包Pathview 完成GO和KEGG分析。
之后是预后基因模型的构建和验证。(1)使用LASSO回归算法,10倍交叉验证构建预后模型。(2)Log-rank检验进行K-M生存分析,time-ROC分析评估模型预后效能。R包forestplot绘制森林分布图。R包rms构建列线图并预测1、3、5年生存率。该部分是文章的主体部分。
最后是探索模型关键基因与MSI,TMB等的关系,并探索关键基因的功能。使用TIMER探索基因表达与免疫浸润之间的关系。R包ggstatsplot分析基因表达和肿瘤突变负荷TMB,微卫星不稳定性MSI的关系。使用GSCALite的CTRP药物分析模块分析NCCGs基因表达与泛癌药物敏感性关系。
结果
HNSC中的NCCGs表达与突变
首先,在TCGA数据库中探讨了42个NCCGS在HNSC和正常组织中的表达。HNSC中共有23个基因表达上调或下调(图1A),SEMA4F、ADRB2、ADRB3、NTRK 1、NTRK 3、LICAM、GDNF、GFRA 2、GRIN2B、GRIN2C、GRIN2D、GRIN3B、CHRM2、CHRM 4、CHRNA 5、CHRNA 6、CHRNA 9、CHRNB2和CHRNB 4上调,而GFRA 1、Slit2、CHRM1、TACR1下调。之后总结了在HNSC中NCCGS的拷贝体突变和体细胞突变的发生率(图1B)。在144份样本中,100份(69.44%)的NCCG发生了改变。最常见的突变类型是错义突变(蓝带)。突变率最高的基因有GRIN2A、GRIN2B、MAP 2、GRIN3A、NTRK 3、CHRM 3、LICAM、GFRA 1和CHRNG。
NCCGs功能富集
通过对NCCGs进行功能富集分析得知,42个NCCGs主要富集在膜电位调节、化学突触、轴突形成等方面(图2A)。此外,KEGC通路富集分析显示,42个NCCGs主要参与神经受体-配体相互作用、钙信号通路等(图2B)。最后,我们对42个NCGs进行了PPI分析,结果显示这些基因之间存在复杂的相互作用(图2C)。
预后基因模型的构建与验证
首先,使用K-M plotter在42个NCCG中寻找预后基因,10个基因预后效果显著,如图3所示。
结果表明,CHRNA 1、CHRNA 5、CHRNB 4、CHRND、CHRNG和LICAM的高表达以及CHRNA 6、GFRA 2、GRIN3A和NTRK 1在HNSC中的低表达与预后不良有关。接下来,在这10个预后基因的基础上,使用LASSO回归分析建立了一个预后基因模型(图4)。共有7个基因被包括在模型中,风险评分risk score=(-0.0117)*NTRK1+(0.057)*LICAM+(-0.5121)*GRIN3A+(0.1541)*CHRNA5+(-0.0146)*CHRNA 6+(0.0795)*CHRNB 4+(0.0564)*CHRND。计算每个HNSC患者的风险评分,并将他们分为高分组和低评分组。风险评分分布、生存状况和7个基因的表达如图4C所示。K-M plotter显示高分组的预后比低评分组差(图4D)。1-、3-和5年ROC曲线的AUC分别为0.605、0.64和0.634(图4e).
最后,用GSE 41613中97例HNSC患者的数据进行了模型的有效性验证。根据危险评分分为高分组和低评分组,用K-M plotter比较预后。结果表明,该模型能较好地判断患者的预后(p=0.0235,图4F)。
构建列线图
之后利用该模型的临床特征和7个基因的表达,建立列线图预测1年、3年、5年生存率。单因素和多因素分析显示以下独立预后因素:CHRNA5、LICAM、CHRND、GRIN3A、年龄、M期和N阶段(图5A,b)。列线图如图5,C指数为0.653。列线图可以预测1、3、5年生存率,与理想模型接近(图5D)。
NCCGs与免疫浸润
神经是肿瘤微环境的重要组成部分,神经系统与免疫系统关系密切。在本研究中使用Timer来探讨预后基因模型中7个基因与免疫浸润的关系,如图6A-G和表1所示。图6A显示CHRNA 5与肿瘤纯度呈正相关(COR=0.189)。图6B显示CHRNA 6与B细胞(COR=0.321)、CD8+T(COR=0.365)、CD4+T(COR=0.553)、巨噬细胞(COR=0.424)、中性粒细胞(COR=0.487)、树突状细胞(COR=0.567)呈正相关,与纯度呈负相关(COR=-0.176)。图6C显示CHRNB 4与B细胞(COR 0.151)、CD8+T(COR=0.101)、CD4+T(COR=0.203)、巨噬细胞(COR=0.152)r和树突状细胞(COR=0.147)呈正相关。图6D显示CHRND与
CD4+T(COR=0.218)、巨噬细胞(COR=0.128)、中性粒细胞(COR=0.133)、树突状细胞(COR=0.127)呈正相关,与纯度呈负相关(COR=-0.112)。图6E显示GRIN3A与B细胞(COR=0.297)、CD8+T(COR=0.479)、CD4+T(COR=0.487)、巨噬细胞(COR=0.486)、中性粒细胞(COR=0.501)、树突状细胞(COR=0.6)呈正相关,与纯度呈负相关(COR=-0.153)。图6F显示LICAM与中性粒细胞(COR=0.125)和树突状细胞(COR=0.116)呈正相关,且呈负相关。CD8+T(COR=-0.119),纯度(COR=-0.107)。图6G显示NTRK 1与B细胞(COR=0.206)、CD8+T(COR=0.387)、CD4+T(COR=0.381)、巨噬细胞(COR=0.371)、中性粒细胞(COR=0.437)、树突状细胞(COR=0.484)呈正相关,与纯度呈负相关(COR=-0.256)。结果表明,NCCGS与免疫浸润密切相关。
NCCGs与TMB, MSI和药物敏感性
TMB和MSI是免疫治疗的预测生物标志物。如图7A所示,CHRNA5和MSI两者之间存在正相关。图7B, E-G呈负相关在CHRNA6, GRIN3A, LICAM, NTRKI和MSL之间。其他CHRNB4、CHRND和MSI(图7C, D)。如图7H所示, CHRNA5、CHRNB4与TME呈正相关,如(图71,K, M, N), CHRNA6, CHRND, LICAM, NTRK1和TMB之间呈负相关,但是没有GRIN3A与TMB之间存在显著关系(图7L)。进一步探索上述基因的潜力在治疗靶点上,探讨了基因之间的关系泛癌的表达及药物敏感性。数据显示药物敏感性与LICAM呈正相关,与CHRND、NTRK1、CHRNA5、GRIN3A呈负相关(图70)。CHRNA6、CHRNB4与药物敏感性无显著相关性
NCCGs与HNSC临床分期
肿瘤基因表达与临床进展密切相关。分析NCCGs与临床分期的关系。数据显示,GRIN3A, NTRK1,和CHRNB4与分期相关(图8A-C)。但我发现CHRND、CHRNA5、LICAM、CHRNA6和分期无关(图8D-G)。
肿瘤微环境中NCCGs的表达
研究表明,模型中的7个预后基因与正常组织相比,HNSC中有高表达。然而,目前还不清楚这些基因在哪些细胞中发挥作用。因此,利用单细胞测序数据探索基因表达在HNSC微环境中的不同细胞中。如图9A, B所示,有肌成纤维细胞,恶性,血浆,成纤维细胞,肌细胞,单细胞/巨细胞,内皮细胞,肥大细胞CD8T、CD8Tex和CD4Tconv在微环境中的作用。CHRNB4主要在恶性肿瘤中表达细胞(图9)。NTRKI基因在肥大细胞中高表达在CD8+ T和成纤维细胞中有少量表达(图9D)。因此,之后重点探讨恶性细胞中存在CHRNB4,肥大细胞中存在NTRKI的功能。
识别CHRNB4在恶性肿瘤细胞中的功能
采用单细胞基因集富集分析,探讨基因可能的功能。选择高表达和低表达CHRNB4的恶性肿瘤细胞进行KEGG通路的基因集富集分析。结果表明,以下通路在高表达CHRNB4的细胞中被激活:戊糖-葡萄糖转化,淀粉-蔗糖代谢,亚油酸代谢。不饱和脂肪酸生物合成,抗坏血酸和乳酸代谢,类固醇激素生物合成,药物代谢,和外部物质的P450代谢(图10)。
识别NTRK1在肥大细胞中的功能
选择NTRKI高表达和低表达的肥大细胞用于KEGG通路的基因集富集分析。结果显示,在NTRKI高表达的肥大细胞中,以下途径被激活:神经酪氨酸信号通路、丁酸代谢、内吞、凋亡、赖氨酸降解、造血系统谱系、甲状腺癌、嗅觉传导(图11)。
到这里文章的主要内容就介绍完了。总结一下,这项研究收集了42个NCCGs,基于这些基因构建了预后模型。在模型构建之外,又探索了关键基因与免疫浸润、TMB、MSI和药物敏感性的关系。最后,通过单细胞测序数据解释了关键基因可能的功能。
这篇文章思路清晰,从基因集的选取到预后模型的构建和验证,以及与其他临床特征的相关性分析,加入TME, MSI, TMB和药物敏感性等分析,使得研究内容丰富,分析全面;又使用单细胞研究关键基因功能,进一步补充研究结果。又有生信分析又有临床结合,又有bulk RNA-seq又有单细胞测序,丰富的生信分析加上优秀的结果,使得文章逻辑清晰,思路新颖,内容详实,可效仿性极强,值得各位老师参考。
参考文献:
Identification of the Nerve-Cancer Cross-Talk-Related Prognostic Gene Model in Head and Neck Squamous Cell Carcinoma. PMID: 34912722