人乳腺癌单细胞深度解析
今天给大家介绍一篇人乳腺癌的单细胞测序文章,该篇文章发表在Nature Genetics,该期刊在最近一年的影响因子为38.33,比上一年增加了10.727。中科院大类: 生物学 1区中科院小类: 1区 遗传学。这篇文章最大的特色是深度解析人乳腺癌单细胞测序。
根据雌激素受体(ER)、孕激素受体(PR)的表达和人表皮生长因子受体2(HER2)的过度表达或HER2基因ERBB2的扩增,对乳腺癌进行临床分层。形成了三个与预后相关并确定治疗策略的广泛亚型:Luminal(ER+,PR+/−);HER2+(HER2+,ER+/−,PR+/−);以及三重阴性乳腺癌(TNBC;ER−,PR−,HER2−)。根据使用PAM50基因signature的转录图谱,乳腺癌也被分成五个“intrinsic”分子亚型:luminal(官腔样型)样型(Luma和Lumb);HER2富集型(HER2E);基底样型;以及正常型。分子亚型和临床亚型之间有大约70-80%的符合率。虽然PAM50对预后和治疗提供了重要的见解,但目前对这些亚型在细胞分辨率上的功能理解是有限的。
人类乳腺癌的高分辨率细胞景观
总共有130,246个单个细胞通过了质量控制,并使用规范的谱系标记进行了注释(Fig. 1a,b)。使用已发表的基因signatures进一步证实了这些高级注释。所有主要细胞类型在肿瘤和临床亚型中均有表达(Fig. 1c)。正如先前在其他癌症中所报道的那样,UMAP可视化显示按肿瘤清楚地分离上皮细胞,尽管三个簇包含来自多个患者和亚型的细胞(Fig. 1d,e)。这些细胞经鉴定为正常乳腺上皮细胞(Fig. 1f)。由于乳腺癌在很大程度上是由DNA拷贝数变化驱动的,作者使用inferCNV估计了单细胞拷贝数变异(Cnv)谱,以区分肿瘤和正常上皮细胞(Fig. 1f)。这揭示了患者特有的拷贝数变化,以及在乳腺癌中常见的那些变化,例如管腔癌中chr1q的增加和基底样癌中chr5q的丢失。
SCSubtype:scRNA-seq数据的内在子类型
由于单细胞数据固有的稀疏性,作者开发了一种与scRNA序列兼容的内在分子分型方法。作者根据每个肿瘤的scRNA-seq构建了“Pseudobulk”图谱,并应用了PAM50质心预测因子。为了确定一个稳定的训练集,作者使用了使用大约2,000个基因的固有乳腺癌基因list3和1,100个乳腺肿瘤的癌症基因组图谱(TCGA)数据集,对Pseudobulk进行了分层聚类。训练样本选自在Pseudobulk PAM50亚型和TCGA聚类之间具有一致性的样本。对于训练数据集中的每个PAM50亚型,作者进行了肿瘤细胞和差异基因表达的成对整合,以确定4组定义单细胞衍生分子亚型的基因。作者将这些基因定义为“SCSubtype”基因signatures(Fig. 2a)。SC亚型显示,在20个样本中,有13个肿瘤细胞不到90%属于一个分子亚型,而只有一个肿瘤(CID3921;HER2E)显示出完全同质的分子亚型(Fig. 2b)。在一些腔内肿瘤和HER2E肿瘤中,SC亚型预示着少量的基底样细胞,并且作者在两个ER+的病例中用免疫组织化学(IHC)证实。在其他ER+的肿瘤细胞中,有少量形态上的恶性细胞ER阴性,细胞角蛋白-5(CK5)阳性,细胞角蛋白-5(CK5)是基底细胞标志物(Fig. 2c). 为了进一步验证SCSubtype,作者计算了上皮细胞分化度(DScore)和增殖度,这两个指标都与每个细胞的分子亚型独立相关。Basic_SC细胞倾向于低DScore和高增殖分数,而Luma_SC细胞显示高DScore和低增殖分数(Fig. 2d),正如在TCGA中观察到的PAM50亚型。
驱动肿瘤细胞异质性的复发基因模块
以前的方法依赖于“bulk”分子亚型的先验知识来开发分类器。为了补充这一点,作者以一种无监督的方式调查了驱动肿瘤内转录异质性(Itth)的信号通路,使用至少50个肿瘤细胞的整合聚集性,产生了574个itth的基因signatures。基因集富集鉴定了这些转基因生物共有的和不同的功能特征(Fig. 2e) GM4在包括MKI67、PCNA和CDK1在内的基因驱动下,独特地富集了细胞周期和增殖的特征(例如,E2F_靶标)。GM3主要富集干扰素反应(IFITM1/2/3,IRF1),抗原呈递(B2M;HLA-A/B)和上皮-间质转化的标志(EMT; VIM, ACTA2)。Gm1和Gm5具有雌激素反应途径的特征,而Gm1也富集到缺氧、肿瘤坏死因子-α和p53信号转导以及细胞凋亡等通路上。当将所有肿瘤细胞的签名分数关联起来时,也可以看到类似的功能关联。对于每个肿瘤细胞,作者计算了七个GMs的签名分数,并使用分层聚类来识别细胞相关性。这清楚地将肿瘤细胞分组,减少了图1d-f中所见的巨大的肿瘤间变异性。作者还发现有一些模块与SCSubtype调用相关联,而其他模块则显示与更多样化的子类型关联(Fig. 2f,g)。最后,作者使用基于GM的细胞状态分配来观察肿瘤细胞在肿瘤内的异质性。类似于SCSubtype(Fig. 2b),作者看到了细胞异质性的证据,这种异质性与肿瘤亚型大致一致,但不受肿瘤亚型的限制(Fig. 2h)。SCSubtype和GM分析为肿瘤性ITH的分类提供了互补的新方法,并提供了进一步的证据表明癌细胞在大多数肿瘤中表现出不同的表型。
乳腺癌的免疫环境
为了高分辨率地检测乳腺肿瘤的免疫环境,作者将免疫细胞重新聚集,以鉴定T细胞和先天淋巴样细胞、髓系细胞、B细胞和浆母细胞。作者使用转录本和表位的细胞索引通过测序(cite-seq)对4个样本进行免疫表型分型,并进行基于锚点的整合以将蛋白表达水平转移到剩余的病例,这显示出与实验测量值高度相关。
淋巴细胞和先天淋巴样细胞
作者在患者中识别了18个T细胞和先天淋巴细胞团(Fig. 3a)。CD4簇包括CD25蛋白标记的FOXP3+的调节性T(Treg)细胞(CD4+T细胞:Foxp3/c2)、滤泡辅助T(TFH)细胞(CXCL13、IL21和PDCD1;CD4+T细胞:CXCL13/c3)、幼稚/中央记忆CD4+(CD4+T细胞:CCR7/c0)和1型辅助T(TH1)CD4效应记忆T(TEM)簇(CD4+T细胞:IL7R/C1)(Fig. 3b)。作者还根据自然杀伤细胞(NK细胞:AREG/C9)和自然杀伤T细胞(NKT细胞:FCGR3A/C10)的αβT细胞受体和NK标志(KLRC1、KLRB1、NKG7)的表达,鉴定了NK细胞(NK细胞:AREG/C9)和自然杀伤T样细胞(NKT细胞:FCGR3A/C10)(Fig. 3b) 。与TNBC中TILs和CD8+T细胞的富集相一致,T细胞簇Ifit1/c6、LAG3/c8和MKI67/c11在TNBC样本中所占比例较高(Fig. 3c)。这些群集在临床亚型之间有质的差异,在TNBC病例中,来自LAG3/c8和IFNG/c7群集的CD8+T细胞具有显著更高的功能障碍分数(Fig. 3d)。此外,腔内肿瘤和HER2+肿瘤的检查点分子表达不同于TNBC (Fig. 4f)。值得注意的是,在TNBC中,LAG3/c8缺失的CD8亚群PD-1(PDCD1)、LAG3以及CD27和CD70的配体-受体对的表达明显增高,这些亚群可以增强T细胞的细胞毒性(Fig. 4f)。作者检测了PDCD1、CD27、LAG3和CD70在乳腺癌国际联合会(METABRIC)40个队列的分子分类中的表达,这些分子在基底样亚型和HER2+亚型中持续富集。当作者使用无监督的分层聚类检查整个数据集中时(更广泛的免疫检查点分子列表),临床亚型之间检查点分子表达的差异更为明显,包括在CAF等非免疫细胞。这些数据提供了对每种亚型疾病最合适的免疫治疗策略的见解。当作者重新聚集B细胞时,作者观察到两个主要的亚群(幼稚和记忆B细胞),其中浆母细胞形成一个单独的簇。另外的亚群似乎主要是由B细胞抗原受体特异性基因片段驱动的,而不是可变的生物基因表达程序。
髓系细胞
髓系细胞形成13个簇,在所有肿瘤中都能以不同的频率被识别出来(Fig. 4a)。没有检测到粒细胞,可能是因为它们对肿瘤解离方案的敏感性和它们的低丰度。单核细胞形成三个簇:Mono:IL1B/c12;Mono:S100A9/c8;和Mono:FCGR3A/c7。Mono:FCGR3A群体形成了一个以CD16蛋白高表达为特征的独特的小簇(Fig. 4b,c)。值得注意的是,作者发现了两个新的巨噬细胞群(LAM1:FABP5/c1和LAM2:APOE/c2),超出了传统的M1/M2分类,占总髓系细胞的30-40%(Fig. 4a–c)。这些细胞与在肥胖小鼠和人类中扩张的脂质相关巨噬细胞(LAM)群体具有密切的转录相似之处,包括TREM2和脂质/脂肪酸代谢基因(如FABP5和APOE)的高表达(Fig. 4c)。LAM1/2独特表达CCL18,其编码的趋化因子在免疫调节和肿瘤促进中起重要作用。作者观察到在HER2+肿瘤中LAM1:FABP5细胞的比例大大降低(Fig. 4d)。提示肿瘤基因组学或微环境的独特特征决定了LAM1/2的命运。使用METABRIC队列进行的生存分析表明,LAM1:FABP5特征与较差的生存相关(Fig. 4e)。而编码PD-L1(CD274)和PD-L2(PDCD1LG2)的RNA在Mac:CXCL10和DC:LAMP3髓系群体中高度共表达(Fig. 4f)。对CITE-SEQ数据的分析表明,PD-L1和PD-L2蛋白在Mac:CXCL10,LAM1:FABP5,LAM2:APOE和DC:LAMP3簇中的表达分布更广(Fig. 4b)。强调LAM1/2是免疫调节分子的重要来源。
基质亚类与不同的分化状态相关
在间质隔室中,作者鉴定出三种主要的细胞类型(Fig. 5a,b)。包括CAFs(PDGFRA和COL1A1Fig. 5c,d) 血管周围(PVL)细胞(MCAM/CD146、ACTA2、PDGFRb;Fig. 5e,f), 内皮细胞(PECAM1/CD31和CD34;Fig. 5g,h),外加两个较小的淋巴管内皮细胞群(LYVE1)和循环PVL细胞群(MKI67)。用Monocle 2进行的伪时间轨迹分析揭示了五个CAF状态(Fig. 5c)。对于PVL细胞,作者确定了三种状态(Fig. 5e) 。PVL S1和S2表达与干细胞、未成熟周皮细胞(PDGFRb、ALDH1A1、CD44、CSPG4、RGS5和CD36)和粘附分子相关的标记(ICAM1, VCAM1 and ITGB1)有关。它们进一步在与受体结合和血小板衍生生长因子活性相关的通路上富集。RGS5、CD248和THY1定义S2的分支。与基因表达一致,在早期PVL状态s1和s2中,CITE-SEQ显示细胞表面CD90(THY1)以及整合素分子CD49a和CD49d出现富集(Fig. 5i,j)。随着细胞向PVL s3过渡,这些标志物的表达下降,PVL s3富含收缩相关基因(MYH11和ACTA2)(Fig. 5f),以及与平滑肌表型相关的通路。PVL状态部分富集到肌成纤维细胞样CAF基因特征。CAF标记物ACTA2的共同表达提示PVL S3细胞历史上在IHC分析中被错误地归类为CAF。作者确定了三种内皮状态(Fig. 5g)。内皮S1类似于柄状内皮细胞和小静脉内皮细胞(ACKR1, SELE and SELP),并且富集到与细胞粘附相关的途径 (ICAM1和VCAM1)和抗原提呈/主要组织相容性复合物(HLA-DRA)。随着细胞分成两种状态,这些标记物随着伪时间的延长而减少,两者都伴随着DLL4的表达升高,DLL4是一种内皮尖状细胞的标记物(Fig. 5h)。
绘制乳腺癌异质性的空间图谱
为了深入了解细胞类型的空间组织,作者对6个样本进行了空间分辨转录组学研究,其中包括来自作者scRNA-seq队列的两个ER+(CID4535和CID4290)和两个TNBCs(CID44971和CID4465),以及另外两个TNBCs(1142243F和1160920F)(Fig. 6a)。 为了解每个大约55微米直径斑点的细胞组成,作者应用了一个立体显微镜的概率模型,使用的是临床亚型匹配的scRNA-seq数据。细胞类型与其适当的病理注释相关联(Fig. 6b)。作者早些时候表明,GMs富集了不同的微环境相关途径和因子。作者在6个病例中通过立体显微镜和病理学鉴定癌细胞的位置。然后检查了7个GM signatures的强度。这揭示了在TNBC病例中GM3(EMT、IFN、MHC)和GM4(增殖)的预期富集,以及在ER+病例中GM1和GM5(ER、Luminal)的预期富集(Fig. 6c)。这些数据表明,这些GM不是基于解离方法的产物。为了系统地理解模块之间的空间关系,作者计算了所有癌症部位GM评分之间的皮尔逊相关性。这揭示了这两个簇在六个案例中大部分是保守的,其中一个簇包括GM1、GM3、GM5和GM6,而另一个簇则是GM2和GM4 (Fig. 6d)。 有趣的是,GM3(EMT、IFN、MHC)和GM4(增殖)在所有样本中都显示出强烈的负相关(Fig. 6e–g)。这表明这些不同的癌症表型发生在乳腺癌的相互排斥的区域。
绘制新的异型细胞相互作用图
6个病例中有5个病例发现了肌成纤维细胞样CAF和iCAF之间存在适度的负Pearson相关性(Fig. 7a–c)。在7例HER2+乳腺肿瘤的独立空间转录学数据集中,CAF定位是一致的,这表明这种关系在临床亚型中是保守的(Fig. 7a)。与上述iCAF的免疫调节特性一致,iCAF在两项研究中都与几个淋巴细胞群体共定位,包括记忆/幼稚B细胞和CD4+/CD8+T细胞(Fig. 7a 和 Fig. 7d,e)。6例肌成纤维细胞样CAF与CD8+T细胞的相关(Fig. 7a),这提示可能与高TIL浸润或具有炎症表型的浸润性乳腺癌的功能相关。为了探索这些区域的CAF-淋巴细胞相互作用的潜在介质,作者研究了CAF和CD4+/CD8+T细胞最丰富的部位的顶端配体-受体相互作用,并通过scRNA-seq检测到了这两种细胞类型所检测到的顶端配体-受体相互作用。这揭示了免疫调节因子配体和同源T细胞受体的富集,包括趋化因子(CXCL12/CXCL14-CXCR4和CXCL10-CXCR3)、补体途径、转化生长因子-β(TGFB1/TGFB3-TGFBR2)和淋巴细胞抑制/激活分子(LTB-LTbR、TNFSF14-LTbR和LTB-CD40、VTCN1/B7H4-B) (Fig. 7f)。通过将信号预测与周围细胞邻相结合,发现这些数据突出了CAF直接调节免疫细胞。在所有Viium病例中,LAM1和LAM2细胞均出现在浸润性癌区;然而,从形态学上看,LAM2也存在于间质细胞、脂肪细胞和淋巴细胞的区域。LAM1和LAM2细胞在大多数情况下表现出适度的空间负相关,这可能表明一个共同的LAM细胞通过其局部的TME向LAM1或LAM2极化(Fig. 7a) 在三种亚型的八种肿瘤中,LAM2细胞而不是LAM1细胞与CD4+和CD8+T细胞呈正相关(Fig. 7a) 此外,在许多病例中,Mac:CXCL10/c9和CD8T细胞之间存在正的Pearson相关性(Fig. 7a),这主要集中在标记为浸润性癌+间质+淋巴细胞的斑点上(Fig. 7g)。提示这些生态位在调节抗肿瘤免疫方面可能具有功能相关性。
乳腺肿瘤生态型与患者生存相关。
作者的单细胞数据产生了乳腺肿瘤的细胞分类方案,在26个肿瘤中观察到细胞频率的显著变异和重复模式。于是作者假设乳腺癌的亚群可能具有相似的细胞组成和肿瘤生物学。并且对METABRIC队列中的所有原发性乳腺肿瘤数据集进行了去卷积。共识聚类显示,有9个肿瘤簇具有相似的估计细胞成分(‘ecotypes’) (Fig. 8a–c)。这些生态型与肿瘤亚型、SC亚型细胞分布和多种主要细胞类型相关(Fig. 8a)。生态型3(E3)的肿瘤富含Basal_SC、Cycling和Luminal_前体细胞(推测是基底乳腺癌的起源细胞)和基本PAM50亚型(Fig. 8a,b)。而E1、E5、E6、E8和E9则以腔细胞为主。生态型还具有独特的基质和免疫细胞富集模式。E4高度富集到与抗肿瘤免疫相关的免疫细胞(Fig. 8a) 。包括耗竭的CD8T细胞(LAG3/c8)、TH1(IL7R/C1)和中央记忆性CD4 T细胞(CCR7/c0)。E2主要由LumA和正常样肿瘤组成(Fig. 8b) 。至于预后,E2肿瘤患者的预后最好(Fig. 8d,e)。而E3的肿瘤与较差的5年存活率有关(Fig. 8d)。这与已知的基底细胞样高增殖性肿瘤预后不良是一致的。E7预后也较差,以HER2E肿瘤和HER2E_SC细胞富集为主。E4也有较高的HER2E和基底样瘤富集(Fig. 8b),然而,这些患者的预后明显好于E7 (Fig. 8f)。可能是由于抗肿瘤免疫细胞的渗透所致。
在这项研究中作者为乳腺癌分类提供了一个完整的细胞模型的重要进展。从三个层面定义了乳腺肿瘤的细胞结构。首先,详细介绍了包括脂肪细胞、肥大细胞和粒细胞的细胞类型。作者通过对完整组织进行空间转录,部分解决了这一问题。与此同时,未来的工作可能会应用互补技术,如单核或基于微孔的测序。其次是每个临床亚型的病例数量有限,这限制了作者估计亚型特异性特征的能力。