据研究报道,与欧洲血统的白人女性相比,非洲散居的黑人女性患乳腺癌的可能性更大,死亡率更高。虽然种族间的种系变异是已知的,不同的体细胞进化还没有详细的研究。分析了97例乳腺癌的深层全基因组,其中RNA-seq是一个子集,与癌症基因组图谱(n = 76)相比,尼日利亚妇女的基因组不稳定性更高,肿瘤内异质性增加,以及由早期克隆GATA3突变定义的独特基因组亚型,诊断时年龄更小10.5岁。研究人员还发现了良性驱动程序(ZNF217和SYPL1)中的非编码突变,以及此前未报道的与非洲血统比例密切相关的INDEL标签,这强调了在生物医学研究中扩大多元化人群的必要性。最后,研究人员证明了表征肿瘤的同源重组缺陷在分层患者进行潜在的挽救生命的治疗方面具有重要的临床意义。
与其他血统的女性相比,世界范围内非洲血统的黑人女性面临乳腺癌的年龄更小,在临床上经历更多的侵袭性疾病,在诊断时出现更严重的疾病,并遭受更高的死亡率。而社会经济和解释这种差异的一些结构性障碍,女性的非洲血统也有较高的雌激素受体阴性(ER)和孕激素受体阴性(PR)或HER2 +亚型乳腺癌。据估计,至少40%的这种亚型分布是由遗传因素引起的。乳腺癌基因组研究揭示了种系易感突变频率、体细胞突变景观和突变特征的群体特异性差异,反映了分子亚型的群体差异。非洲血统的乳腺癌患者表现出更多的TP53改变和更少的PIK3CA改变。尼日利亚HR+ /HER2肿瘤的特征是同源重组缺陷(HRD)标签增加。来自非洲血统患者的肿瘤以前也被证明有增强的肿瘤内异质性(ITH)。全基因组测序(WGS)和配对的生殖系组织可以用来重建乳腺肿瘤的进化生命历史,为早期或晚期克隆和亚克隆基因组事件提供详细的路线图,帮助优先确定治疗靶点。然而,到目前为止,乳腺癌的进化和克隆结构主要是从非非洲血统的肿瘤中得到。研究人员假设,通过研究非洲土著妇女肿瘤的进化轨迹,可以深入了解与之前研究不足的人群中乳腺癌负担相关的群体特异性基因组特征。在这里,研究人员对一个非洲黑人土著人口进行生活史分析,由于之前从非洲血统乳腺癌患者中获得的基因组数据极其缺乏。
对100例乳腺肿瘤进行高深度WGS(90深度;其中49个具有互补RNA-seq)和配对的正常组织(深度30),这些组织来自先前描述的尼日利亚乳腺癌妇女8。这些肿瘤体细胞进化的关键事件被识别出来,并与来自癌症基因组图谱(the cancer Genome Atlas, TCGA)的76例乳腺癌病例的WGS相似分析进行了比较。由于低纯度估计,来自尼日利亚的3个样品被排除,最终一组173个样品包括尼日利亚黑(尼日利亚简称,n = 97)、白色TCGA(白色简称,n = 46)和黑色TCGA(黑色简称,n = 30)组(补充表1和补充图1)。尼日利亚病例的流行病学危险因素见补充表2。TCGA乳腺癌患者的遗传信息来源于研究人员之前的研究。
研究人员观察到,与白人组和黑人组相比,尼日利亚组有更高的插入和缺失(indel)负担,在调整临床亚型后仍然显著。然而,单核苷酸变异(SNV)率在种族/民族之间没有显著差异。体细胞编码驱动程序与cDriver(复发率2%)和MutSigCV独立。共鉴定出13个驱动基因。将驱动基因分为致癌基因(oncogenes, ONC)和抑癌基因(tumor suppressor gene, TSG)。GATA3表现出最强的TSG信号,在之前未报道的五个被检测到的驱动基因中,三个显示数次信号。突变的癌细胞分数(CCF)分布显示,大多数Driver发生无性生殖,即在所有肿瘤细胞,与CCF的分布无显著差异前突变Driver(在10%)在三组。Driver富集分析确定GATA3作为唯一的Driver在尼日利亚分组中富集。调整临床亚型后,这种富集仍然显著。亚型分层分析发现,LAMB3在HER2+肿瘤中富集,尽管在多次检测校正后缺乏意义。LAMB3仅发生在尼日利亚HR /HER2+患者。TP53在ER患者中富集。有趣的是,尽管GATA3据报道强烈富集在独特的ER + 肿瘤,研究人员没有观察到这样一个富集在尼日利亚组中。
研究人员通过比较尼日利亚、黑人和白人群体,确定了非编码突变的热点。基因组的两个区域显示出显著差异,在尼日利亚组和白人组之间的突变率(图2),两者都在尼日利亚组中过度代表。尼日利亚人和黑人群体之间没有显著差异。最强的信号在20q13.2处发现,突变聚集在ZNF217的上游,ZNF217是一种编码转录因子的基因,是肿瘤发生的关键调控因子,先前与乳腺癌的临床结果相关。第二个热点被发现在7 q22.3内部和侧翼SYPL1 (Synaptophysin-like 1)。尽管没有证据的协会与乳腺癌,这种基因已经在肝细胞之前与临床结果和胰腺导管。
研究人员发现从白人到黑人到尼日利亚群体的基因突变流行率都存在显著的正变异,表明与非洲血统有关。尼日利亚WGS样本的一个子集(n = 49)获得了全转录组数据。在尼日利亚和黑人组中检测了非编码突变对这两个基因表达的影响。研究人员在突变肿瘤中观察到这两种基因的表达升高;然而,没有发现有统计学意义。所鉴定的非编码突变的功能后果还有待确定。
体细胞突变标志可能为乳腺癌的外源性和内源性危险因素提供病因学解释。突变标签分析鉴定出13个单碱基替代(SBS) COSMIC标签(图3a、b)。在5%的样本中观察到的标签之前已经报道过类似的顺序,除了SBS39,这是一个最近发现的标签。这个罕见的SBS标签(SBS17a/b、SBS7b、SBS15和SBS28)主要在尼日利亚和黑人群体中观察到,这些标签的平均流行率分别为2.8和3.3%。在所有组中观察到HRD标签SBS3。然而,与白人组相比,黑人组和尼日利亚组的活性略高。9个双基替代(DBS)标签也被识别出来,其中5个以前未被报道。两组间dbs频率相似,DBS-B在尼日利亚人的贡献高于白种人(1.55倍)和黑种人(1.42倍)。
共检测到12个INDEL标签,其中ID8和INDEL- b标签频率最高。值得注意的是,以前未报告的标签INDEL-B不仅大大减少白色组相比,尼日利亚和黑色组,但是它也表现出明显的积极渐变,从白到黑到尼日利亚组在患病率(图3c)和活度(图3d)。虽然这种标签的病因还有待阐明,但数据表明这与最近的非洲血统有很强的联系。在任何其他INDEL标签中都未观察到此关联。
HRD SBS标签(SBS3)分别在4/7和7/8种系和体细胞BRCA阳性肿瘤中检测到。虽然四个具有种系或体细胞BRCA变异的样本均缺乏SBS3,但所有四个样本都表现出较高的INDEL标签ID6和ID8活性(补充图16),这两个标签都与通过非同源端连接修复DSB有关。为了进一步阐明HRD肿瘤的分类,研究人员将CHORD29应用于整个数据集,发现34%的肿瘤为hr缺失(图4和补充图18)。在任何种族组或临床亚型中均未观察到HRD显著增加(补充图18);然而,与黑组和白组相比,尼日利亚HR+ /HER2肿瘤组HRD升高,这与研究人员之前的发现一致。与SBS3不同,所有BRCA阳性肿瘤都被CHORD分类为HR缺陷。此外,研究人员观察到ID6 + ID8标签活动与CHORD HRD评分之间存在很强的正相关,并明确了一组具有高ID6 + ID8活性和高CHORD评分的肿瘤,其中34例(67%)为BRCA阴性肿瘤(补充图19)。这表明,这两种指标都可以用于识别hr缺失的肿瘤,更高的临界值的CHORD评分可以稳定地对HRD肿瘤进行分类。
接下来,研究人员使用CHORD预测BRCA类型,并检测其与驱动突变的相关性。所有BRCA1和BRCA2阳性肿瘤均经CHORD正确分类。伴有PALB2的HR缺失肿瘤也被归为BRCA2型。在那些hrd相关基因没有突变但在高评分集群中的肿瘤中,70%是BRCA1型,尼日利亚人与非尼日利亚人相比,BRCA1型明显富集。除了CHORD,为了确认这两种BRCA类型的存在,研究人员进行了SV标签分析,并提取了7个SV标签。研究人员识别了不同的BRCA1-和BRCA2-相关特征(分别为S3和S2),这与基于chord的BRCA类型肿瘤分类匹配良好(图4),显示S2活性在BRCA2型肿瘤中显著富集和BRCA1型肿瘤中S3活性。
这些结果表明:
1. SBS3对HRD的分类能力较差;
2. 将INDEL和SV结合CHORD HRD评分不仅在识别hr缺陷肿瘤方面有优势,而且这些信息还可以用于推断其BRCA类型。
基因组不稳定性(GI)是一种已知的癌症标志,表现为全基因组重复(WGD),染色体不稳定(CIN)和Kataegis突变。研究人员观察到尼日利亚人的WGD发生率比白人组高3倍,但两组与黑人组之间没有显著差异。有趣的是,研究人员观察到从白人组到黑人组和尼日利亚组的WGD率呈显著的正趋势。所有样本的基因组改变比例随CNA片段数(PGAn)的调整而计算,作为CIN的测量方法。研究人员观察到,与非WGD肿瘤相比,WGD肿瘤的PGAn高1.8倍, HR /HER2肿瘤仅在尼日利亚组显示这种模式(补充图23)。
PGAn与突变量也显著相关(补充图24)。研究人员在64.2%的样本中观察到Kataegis突变,这是一种通常与基因组重排相关的局部超突变现象,其中3.6%都是尼日利亚人,发生了超过10起Kataegis突变。kataegis foci的大部分snv是CT和CG突变,与APOBEC突变签名SBS2和SBS13相关。尼日利亚分组在白色和黑色组层面表现出更多的焦点(补充图26)。
PlackettLuce概率框架被用于重建所有肿瘤基因组畸变的最可能的时间顺序。分析中包含的基因组畸变包括富集的CNAs、WGD和常见的突变驱动因子,所有这些都基于克隆性排序。图6描述了尼日利亚数据集基因组事件的相对时间。GATA3和TP53的突变被发现是早期驱动因子。除了已知的8p LOH和17p LOH等早期事件外,9q34.2 LOH、14q LOH、15q14-q21.3 LOH和19p13.3 LOH也属于早期驱动因素。相比之下,在White组中,19p13.3 (STK11) LOH在WGD前没有发生,但8p11.21增加在wgd前发生。这种增加事件和19p13.3 LOH分别包含ANK1和STK11基因,这两者都与肿瘤发生有关,已经在转移性乳腺癌中报道了STK11拷贝数丢失。仅排序HR /HER2+亚型、13q LOH、14q LOH和8p11.21增益早在已知的早期驱动(8p LOH和17p LOH)就出现了,其中14q LOH在White HR /HER2+组中几乎不存在。
ITH采用加权癌细胞分数(wCCF)进行评估,wCCF是一种包含亚克隆突变数量和CCF的度量。尼日利亚癌症患者的ITH显著高于White组。亚克隆性最高的5个样本均为尼日利亚。其中一个样本在已知的驱动基因MAP2K4和RB121中有亚克隆突变,另一个样本在之前未报道的驱动基因F5中。其余3个样本分别在COSMIC TIER1基因ATR、ATRX和KMT2D中携带可能的驱动突变。此外,在5个样本中的2个中观察到与ITH37增加相关的表观遗传调控因子PRDM14的突变(补充图28)。
最后用加权癌细胞分数 (wCCF) 评估肿瘤内异质性 (ITH),尼日利亚的 ITH 比白人组高,对突变和 CNA 事件进行成对相互作用分析,发现大多数 CNA 事件同时发生,但是 GATA3 和 TP53 突变几乎很少同时出现。
前面观察到 GATA3 和 TP53 突变几乎很少同时出现,说明 GATA3 和 TP53 突变可能表征了不同的癌症类型,因此,作者在尼日利亚队列中进一步表征 GATA3 和 TP53 突变相关的亚型。结果显示 GATA3 突变亚型的患者诊断年龄比其他亚型小10.5 岁,GATA3 阳性肿瘤患者比 TP53 阳性肿瘤患者有更低的拷贝数负荷。
参考文献:
Ansari-Pour, N., Zheng, Y., Yoshimatsu, T.F. et al. Whole-genome analysis of Nigerian patients with breast cancer reveals ethnic-driven somatic evolution and distinct genomic subtypes. Nat Commun 12, 6946 (2021). https://doi.org/10.1038/s41467-021-27079-w
这个研究在揭示乳腺癌的基因组复杂性方面已经取得了重大进展,其中一个关键的改进是乳腺癌基因组分类的发展。在研究人员的队列中,确定了三个基因组亚型,其中GATA3亚型在尼日利亚组中强烈富集。这些基因组亚型表现出不同的突变特性。对于靶向治疗有着深刻的意义。