天津医科大学肿瘤医院副院长徐波发表在Frontiers in Oncology的文章Genomic Heterogeneity and Clonal Evolution in Gastroesophageal Junction Cancer Revealed by Single Cell DNA Sequencing
摘要
胃食管交界(GEJ)癌是一种发生在胃和食管交界处的肿瘤。GEJ癌经常转移到淋巴结,但其异质性和克隆进化过程尚不清楚。这项研究是首次使用单细胞DNA测序来确定与淋巴结转移相关的基因组变异和克隆进化。进行多重退火和基于环的扩增循环(MALBAC)和大量外显子组测序,分别检测单细胞拷贝数变异(CNV)和单核苷酸变异(SNV)。四名GEJ癌症患者入选,其中两名(第3位,第4位)有淋巴结转移。我们发现最常见的突变发生在TTN基因中,据报道该基因与癌症中的肿瘤突变负担有关。发现SNVs和CNVs存在显著的患者内异质性。我们确定了每个肿瘤中的SNV亚克隆结构。为了研究CNV的异质性,对单个细胞进行测序。原发肿瘤中的亚克隆数大于淋巴结中的亚克隆数,表明原发部位的异质性较高。我们观察到两种多站淋巴结转移模式:一种是跳跃转移,另一种是跟随淋巴引流。综上所述,我们的单细胞基因组分析揭示了GEJ癌的异质性和克隆进化。
介绍
上消化道癌症包括食管癌(EC)、胃食管交界癌(GEJ)和胃癌(GC)。食管癌根据组织病理学分为鳞状细胞癌或腺癌,而GEJ癌和GC主要为腺癌。虽然GEJ癌可以被归类为EC或GC的一部分,但在大多数情况下,它被归类为后者。然而,GEJ癌和远端GC在流行病学、危险因素、起源和预后方面表现出不同的特点。与GC相比,GEJ癌具有更强的穿透性,更容易发生淋巴结转移,预后更差。近年来,由于幽门螺杆菌感染的有效根除,胃癌的发病率逐渐下降,而GEJ癌的发病率则逐渐上升,这是反流性疾病的主要危险因素。
GEJ癌症的基因组研究主要集中在批量测序。例如,在对GC患者(包括GEJ癌症)的大量基因组研究中,GC亚型的鉴定提供了靶向治疗的可能性。另一项针对大队列GEJ癌症患者的大样本基因组研究发现了生存时间的独立标志物。然而,肿瘤具有明显的瘤内异质性(ITH)。批量测序只能显示主要细胞群的特征,缺少异质性信息。单细胞测序是解决ITH的有力工具。目前上消化道肿瘤的单细胞研究主要集中在RNA水平。单细胞RNA测序可以确定细胞组成和转录表达。但它不能揭示淋巴结转移的克隆进化,而淋巴结转移与癌症的不良预后相关。此外,随着时间的推移,肿瘤通过获得一系列突变而发生,基因组不稳定性和突变是肿瘤的特征。目前,在单细胞基因组水平上还没有关于GEJ癌伴转移淋巴结的研究。
单细胞DNA测序可用于在拷贝数变异(CNV)和单核苷酸变异(SNV)水平上揭示ITH和系统发育,已广泛用于癌症研究。多重退火和基于环的扩增循环(MALBAC)是一种单细胞DNA测序方法,可显著减少扩增偏差并提高基因组一致性。在本研究中,通过MALBAC方法,我们首次在单细胞水平上揭示了GEJ癌淋巴结转移的基因组异质性和克隆进化。我们的研究发现GEJ癌存在显著的肿瘤内异质性和不同的淋巴结转移模式。这些结果可能会提高我们对GEJ癌症的理解。
材料和方法
样本采集
天津医科大学肿瘤研究所和医院(2020年5月至2020年10月)登记了四名GEJ癌症患者。纳入标准:(1)未接受治疗的患者;(2) 接受根治性手术的患者。收集4例患者手术切除的原发肿瘤组织及邻近正常组织。三名患者被诊断为淋巴结阳性。还收集了两名患者的阳性淋巴结(一名患者的淋巴结不适合单细胞测序)。本研究由天津医科大学肿瘤研究所和医院伦理委员会批准(编号:bc2020180)
单细胞全基因组扩增
根据先前报告的MALBAC方法进行单细胞扩增(24)。这种全基因组扩增方法引入了准线性预扩增,可以减少扩增偏差。简言之,进行了九个周期的预放大和随后的指数放大。扩增产物用安瓿XP珠(Beckman Coulter,Brea,CA,USA)纯化并用量子位4定量。0荧光计(美国马萨诸塞州沃尔瑟姆市Invitrogen)。使用定量PCR(qPCR)检查基因组的完整性(qPCR引物序列如表S2所示)。在随机选择的8个位点中,Ct值<30的不少于6个的细胞可用于文库制备和下一代测序。
文库准备和排序
对于单个细胞,我们为每个细胞构建了全基因组文库。选择的单细胞DNA用Covaris S220超声处理以产生短DNA片段。然后,根据制造商的protocol,使用KAPA Hyper Prep Kit(美国马萨诸塞州波士顿市KAPA)和用于Illumina(美国马萨诸塞州伊普斯维奇市NEB)的NEBNext多重寡糖制备文库。简单地说,主要步骤包括末端修复和A-tailing、adapter连接、连接后清理和文库扩增。qPCR和片段分析用于文库质量控制。所选文库用Illumina NovaSeq 6000测序。
外显子组库由安捷伦SureSelect人类全外显子V6工具包(安捷伦科技公司,美国加利福尼亚州圣克拉拉市)根据制造商协议构建。简而言之,基因组DNA用Covaris S220进行超声处理以产生短DNA片段。经核酸外切酶/聚合酶末端修复、DNA片段3'端折叠和接头连接后,通过PCR富集两端带有接头的DNA片段。用生物素标记探针与DNA文库杂交,用磁珠和链霉素捕获外显子。然后,将捕获的文库添加索引标签并通过PCR反应富集。qPCR和片段分析用于文库质量控制。所选文库用Illumina NovaSeq 6000测序。测序数据已提交给NCBI SRA,生物项目登录号为PRJNA718709。
从单细胞DNA测序数据估计CNV和CNV频率
首先,使用Trimmomatic对原始测序读数进行修剪,以去除适配器和低质量碱基。使用带有“HEADCROP:35”的PairEnd模式从读取开始和其他默认参数中删除低质量的基。然后,使用Burrows–Wheeler比对工具(BWA)在配对末端模式下使用“MEM”命令将clean reads比对到人类参考基因组hg38,并在单末端模式下将未映射的读数重新对齐到相同的参考基因组。使用带有“markdup”的SAMtools去除PCR重复序列。校准后,以2M基因组窗口大小的分辨率用对照FREEC计算单细胞拷贝数值。在R软件中处理从对照FREEC获得的原始拷贝数矩阵。首先,将小于1的拷贝数值转换为1,将大于4的拷贝数值转换为4。然后,对拷贝数值进行log2转换,并通过每个单元格减去一,将其居中至零。
根据初步转换后的拷贝数-值矩阵计算原发性GEJ癌中CNV的频率。窗口大小为2M时,值大于0。3个被视为拷贝数增益,而小于-0.3例被视为拷贝数丢失。每个窗口中有增益或损失的细胞数除以每个患者的原发肿瘤细胞总数,以消除四名患者之间细胞数不平衡的影响。然后将每个窗口的四个加权值相加并除以四。
CNV聚类与克隆进化分析
为了确定聚类数量,计算细胞之间的欧几里德距离(欧式距离),并使用“hclust”进行分层聚类。为了描述入侵期间的克隆进化,我们推断了基因组谱系,并使用R软件包Timescape绘制了数据图。根据聚类结果定义克隆,并计算属于每个克隆的不同来源细胞的比例。
从批量外显子组测序进行SNV分析
原始测序数据的质量控制是通过丢弃包含适配器污染、低质量核苷酸和不可识别核苷酸的读取来执行的。然后,通过BWA-MEM算法将干净的读数映射到UCSC人类参考基因组。如果读取被映射到多个位置,BWA允许选择最有可能的位置(如果多个位置最有可能,则选择是随机的)。SAMtools用于对映射的读取进行排序和合并,Picard用于删除重复项。在删除重复读取、重新校准基本质量分数和局部重新校准后,使用Samtools mpileup和bcftools进行变量调用,并使用基于贝叶斯分类器的muTect检测体细胞SNV。通过分析LOD评分确定变异,并使用过滤器减少系统性假阳性。变异的功能注释,包括基因转录本注释数据库中的信息,如一致性CDS、RefSeq、Ensembl和UCSC,以及其他相关数据库,如dbSNP和1000基因组,使用ANNOVAR给出。
系统发育分析
利用MEGA5软件构建了基于非同义SNV分布的系统发育树。最大-最小分枝定界算法用于推断最大简约树。我们使用平均路径法来计算分支长度。将正常组织作为外组,获得共识树。然后,在Adobe Illustrator软件中重新绘制系统发育树。主干和分支的长度与获得的非同义突变的平均数量成正比,末端分支为红色,内部分支为黄色,主干为蓝色。选择树枝之间的角度只是为了方便显示。代表性driver SNV标记在相应分支的旁边。
结果
GEJ癌症患者的突变景观
在这项研究中,四名患者被纳入研究。我们从所有患者中获得原发肿瘤,并分别从两名患者(Pt.3、Pt.4)中获得两个淋巴结。对于Pt.3和Pt.4,与L2相比,L1在解剖学上更接近原发肿瘤的淋巴结。表S1显示了四名GEJ癌症患者的样本信息和临床特征。为了更好地了解GEJ癌症的基因组异质性和系统发育,我们首先对原发性肿瘤和转移性淋巴结样本进行全外显子组测序(WES)以分析突变。项目概述如图1A所示。
图1 | GEJ癌症患者的突变情况。(A) 项目概述:GEJ癌症患者原发肿瘤和淋巴结转移的基因组图谱。韦斯:全外显子组测序。(B) 显示了体细胞突变的数量。X轴代表不同的样本,Y轴代表SNV的数量。(C) 显示了原发和淋巴结部位的突变谱。X轴代表不同的样本,Y轴代表SNV的比例,不同的颜色代表不同的突变类型。(D) 热图显示Pt原发性和淋巴结的非女性SNV分布。3.(E) 热图显示Pt原发性和淋巴结的非女性SNV分布。4.(F) 热图显示,在四名GEJ癌症患者中,至少有两名患者有反复突变的基因。
使用匹配的正常组织样本作为对照,对原发肿瘤和淋巴结的体细胞SNV进行命名。图1B显示了四名GEJ癌症患者的突变数。对于主要站点,Pt.1名非女性SNV和总SNV数量最多。众所周知,突变随着年龄的增加和Pt的增加而累积。4名患者中,1名年龄最大。Pt.2中SNV的数量是最小的。原发肿瘤在Pt.2例较大,但未诊断出临床转移,这可能与肿瘤突变负荷较小有关。我们还分析了突变谱,显示四名患者的突变类型相似(图1C)。无论是在原发部位还是淋巴结部位,C>T突变都显著富集,这与一组相对较大的中国GEJ癌症患者的结果一致。
虽然患者之间存在相似的突变谱,但患者之间或个体中不同取样部位的突变数量不同。图1D显示了Pt.3和Pt.4中的常见SNV和原发性或淋巴结特异性SNV。原发性或淋巴结特异性突变的比例(原发性或淋巴结突变的数量除以常见突变)在Pt.3(0.40,2.49)和Pt.4 (0. 94, 1. 40)之间是不同的。同样,在同一患者中,原发肿瘤和淋巴结特异性突变的数量也不同。在Pt.3、淋巴结特异性SNV明显多于原发部位(6.31倍)。在Pt.4,淋巴结特异性SNV与原发部位的比值为1.49倍。
接下来,分析四名患者中的复发突变基因。图1显示,最常见的突变基因是TTN,发生在三名患者中。共鉴定出8个突变位点,其中6个发生在Pt.4。TTN基因的突变位点如图S1所示。TTN的大多数突变位点发生在免疫球蛋白I-set结构域。其他常见突变为TP53、TG、LRP1B、AAR2、CCDC108、COL7A1、DNAH17、DYNC1H1、PLXNB2等,发生在两名患者中。
淋巴结间SNV亚克隆构筑
突变等位基因频率用于确定不同采样位点之间的克隆或亚克隆突变。对于Pt.1和Pt.2只有原发性肿瘤的非女性SNV的突变频率如图S2所示。几乎所有SNV均为亚克隆,表明肿瘤内异质性。接下来,我们分析了原发肿瘤和匹配淋巴结之间的突变等位基因频率(图S3)。图S3A和B显示,在Pt.3中,原发肿瘤和L1之间的突变亚克隆结构相对较原发肿瘤和L2更保守。而在Pt.4中原发性肿瘤与L1之间的亚克隆结构与原发性肿瘤与L2之间的亚克隆结构相似(图S3C、D)。
对于Pt.3和Pt.4有两个匹配淋巴结的患者,分析淋巴结之间的突变频率。图2A, B显示Pt.4中两个淋巴结之间的突变频率比Pt.3中更相似,说明Pt.4中两个淋巴结之间SNV的亚克隆结构相对保守。
图2| SNV亚克隆结构和系统发育分析。(A) Pt.3中两个不同LN位点的非同义SNV突变频率。(B) Pt.4中两个不同LN位点的非同义SNV突变频率。(C)基于Pt.3中SNV的系统发育树。(D)基于Pt.4 SNV的系统发育树。
原发性肿瘤和淋巴结的SNV系统发育分析
以上结果揭示了4例GEJ肿瘤患者的突变谱和亚克隆结构。但不同患者的淋巴结转移方式仍需进一步分析。以SNV为基础构建了淋巴结转移瘤Pt.3和Pt.4的系统发育树。图2c显示Pt.3的两个淋巴结位于不同的分支,其中一个淋巴结与原发肿瘤位于同一分支,说明两个淋巴结独立转移。远端淋巴结(L2)从躯干分支较早,说明L2转移较L1早。然而,Pt.4的系统发育模式显示原发部位从躯干分支,两个淋巴结从另一个分支分离(图2D)。图2表明两个淋巴结具有相同的基因组祖先,起源于原发部位,并在淋巴引流后转移。
将COSMIC (Catalogue Of Somatic Mutations in Cancer)数据库和KEGG pathways in Cancer定义为推断的驱动突变,并标记在系统发生树中。TP53突变在Pt.3和Pt.4中均为主干突变,提示TP53突变发生较早,在肿瘤进展和淋巴结转移中发挥重要作用。Pt.3、PIK3CA、JAK2等仅在L1中发生突变,在L2中不发生突变。这可能与两个淋巴结与躯干分离不同分支的现象有关。而在Pt.4中,两个淋巴结分离于同一分支,同时显示POTEF、OSBPL7和CHRFAM7A突变。
SNV系统发育分析显示两例患者的淋巴结转移具有不同的系统发育模式。淋巴结可在不同时间点与原发肿瘤独立分离,并可随淋巴引流逐站转移。
原发肿瘤和淋巴结的CNV异质性
在上述结果中,我们发现SNVs在原发肿瘤和匹配的转移淋巴结之间是不均匀的。接下来,我们在单细胞水平上分析了CNVs的异质性,这是批量测序无法发现的。4例患者210个单细胞通过质量控制,单细胞信息见表S3。首先,我们分析了Pt.1和Pt.2的异质性,他们只收集了原发肿瘤。图3中的热图显示了Pt.1中的全球拷贝数量概况。由于所有单细胞的CNV模式相似,数据确定了CNV事件是克隆的。图3b为归一化后的CNVs,包括Chr8、13、20的扩增和Chr14、15的缺失。图3中的热图显示了Pt.2的全球CNV分布。这些数据在原发肿瘤中发现了两个主要的克隆。图3d显示了两个亚克隆的拷贝数模式。共享的拷贝数包括Chr7、13、20的扩增和Chr5q的缺失。两个亚克隆之间也存在明显的CNV区域,例如亚克隆2中Chr4和14的缺失程度比亚克隆1中更大。
其次,我们分析Pt.3和Pt.4患者的内部异质性,他们有原发肿瘤和淋巴结的单细胞信息。图4A、5分别显示了Pt.3和Pt.4中单个细胞的整体CNV分布图。这些数据在每个病人身上确定了四个主要的克隆。图4B显示了Pt.3中四个亚克隆的拷贝数模式。共享的CNVs包括Chr7p,20的扩增和Chr5q,21的缺失。观察到亚克隆特异的拷贝数变异。图5b显示了Pt.4中四个亚克隆的拷贝数模式。亚克隆间CNV谱的差异揭示了患者内部明显的异质性。这种异质性不仅存在于原发肿瘤或淋巴结中,也存在于原发肿瘤与淋巴结之间。
有报道称原发肿瘤中CNV事件也常发生在单个或多个匹配的淋巴结中,但也有少数在原发肿瘤中未发现淋巴结中CNV。说明原发肿瘤与淋巴结的异质性程度不同。图4A显示在Pt.3中,原发肿瘤由三个亚克隆组成,而L1和L2淋巴结由一个或两个亚克隆组成。图5A还显示Pt.4的原发肿瘤由三个亚克隆组成,而L1和L2淋巴结由一个或两个亚克隆组成。结果表明,同一患者原发性肿瘤的异质性高于淋巴结的异质性。
CNV克隆进化分析
与突变的进化模式不同,CNVs发生在肿瘤进化的早期,随着肿瘤的克隆扩增具有高度稳定性。我们以上的突变数据显示,Pt.3和Pt.4的淋巴结转移系统发育模式是独特的(图2)。接下来,我们利用CNV数据分析克隆进化模式。克隆频率可以分析,以可视化克隆变化与肿瘤转移。根据之前的SNV数据,Pt.3中的两个淋巴结独立来源于原发肿瘤,所以我们分别分析了从原发淋巴结到L1和L2淋巴结各亚克隆的比例变化。
在Pt.3中,原发肿瘤中有3个亚克隆,分别为克隆2、克隆3和克隆4,比例分别为16%、58%和26%(图4C)。在淋巴结中,3号克隆体(原发肿瘤的主要部分)和2号克隆体消失。然而,L1淋巴结出现了一个新的亚克隆(克隆1),占100%。L2淋巴结有2个亚克隆(克隆1和克隆4),其中克隆1占81%。克隆3和克隆1之间CNVs的主要差异是克隆1在Chr1p和18上的特异性缺失。这些CNVs可能与Pt.3淋巴结转移有关。
在Pt.4中,原发肿瘤中有3个亚克隆,分别为克隆1、克隆2和克隆3,比例分别为17%、65%和17%(图5C)。克隆1号和克隆2号消失在淋巴结里。但在淋巴结中出现了一个新的亚克隆(克隆4),L1淋巴结占100%,L2淋巴结占94%。克隆4与其他亚克隆之间CNVs的主要差异是Chr4和6的明显缺失。这些CNVs可能与Pt.4淋巴结转移有关。
Pt.3和Pt.4的克隆进化分析显示,随着GEJ癌的转移,不同亚克隆的比例发生显著变化。这些发现进一步揭示了GEJ肿瘤转移的分子机制。
讨论
本研究的突变谱显示,无论是原发部位还是淋巴结部位,C > T突变均显著富集,说明C > T突变在GEJ肿瘤发生发展中起着至关重要的作用。这与其他研究一致。我们的研究发现TTN、TP53、AAR2、CCDC108、CACNA1E、RYR3、LRP1B等基因发生了反复突变。在这些突变基因中,TP53在最近124例中国GEJ癌症患者的研究中也被报道为突变最显著的基因。另一项研究关注12例同步GEJ癌症和远端胃癌透露TP53突变的优势。TTN的复发性突变,TP53 RYR3和LRP1B基因的研究也发现在我们的研究中, 但我们经常发现新的突变基因,如AAR2 CCDC108和CACNA1E基因。
考虑到GEJ癌的解剖位置在胃和食管之间,我们将4例GEJ癌患者的CNV和SNV结果与胃和食管的TCGA数据进行了比较。对于CNV,我们将患者之间不同的细胞数量归一化,并基于我们4例GEJ癌患者原发肿瘤的86个单细胞计算CNV频率,如图S4所示。与胃癌和食管癌的TCGA数据相比,GEJ癌与EAC(食管癌)或GA-CIN(胃腺癌染色体不稳定性)有相似之处,如Chr7、8、20的拷贝数增加频率较高,Chr4、5、18、21的拷贝数丢失频率较高。对于snv,我们比较了两篇论文中列出的4名GEJ癌症患者中至少两名患者的突变基因。GEJ癌和胃癌或食道癌只有一个共同的突变基因:TP53,表现出不同的突变景观。TP53在我们的GEJ癌患者中突变频率为50%,远低于EC [EAC中的71%,ESCC(食管鳞癌)中的91%],但接近GC(非高突变胃癌中的50%,高突变胃癌中的35%)。
在我们的研究中,我们发现TTN是最常见的突变基因。TTN (Titin)主要在肌肉收缩中起作用。也有报道称TTN在胃腺癌、小细胞肺癌、结直肠腺癌等多种实体瘤中突变基因居首位。TTN在实体瘤中的平均突变频率为29.68%,在胃腺癌中的突变频率高达60%~70%。TTN基因的突变频率也可以用来表示肿瘤突变负担。在一项对12例同步GEJ癌和GC患者的研究中,24例肿瘤组织中有7例发现TTN突变。但TTN在肿瘤发生进展中的作用机制尚不清楚,值得进一步研究。此外,我们进一步跟踪了之前的研究,以发现CNVs/SNVs预测对FDA批准的化疗或靶向治疗药物的脆弱性。我们在表S4中列出了这些cnv和snv。其中ARID1A、ATM、BRCA1、TP53基因突变,CCND1、ERBB2、MYC基因扩增,PTEN、RB1基因缺失等。
Pt.3和Pt.4淋巴结系统发育模式存在明显差异。在Pt.3中,淋巴结与原发肿瘤之间的相似性大于不同淋巴结之间的相似性,说明两个淋巴结均来源于原发肿瘤,独立转移。Pt.3的系统发育树显示L2淋巴结很早就脱离躯干。由于L2淋巴结在解剖学上代表相对较远的淋巴结,这种无性进化模式表明Pt.3的独立和跳跃转移。Pt.4的两个淋巴结位于同一分支,与原发部位分离,提示转移是在Pt.4淋巴引流后发生的。我国GEJ癌患者以胃癌为主,食管癌患者以鳞癌为主。因此,我们比较了我们的研究与已报道的胃癌研究的进化模型。与我们的研究不同的是,以往的胃癌研究揭示了一个共同的系统发育模式,即三个淋巴结都出现在一个单一的分支簇中。
我们还在单细胞水平上分析了CNV数据。以前的研究表明,每个患者需要20-40个单细胞才能研究95%功率的主要亚克隆。因此,我们研究中的单个细胞足以描述亚群体组成。单细胞拷贝数谱和亚克隆组成显示GEJ肿瘤患者存在明显的异质性。Pt.3和Pt.4患者的原发肿瘤亚克隆组成均比淋巴结复杂,说明原发部位的异质性明显高于淋巴结。这可能意味着CNV在肿瘤转移中起决定性作用,只有具有特定CNV模式的细胞才具有转移能力,这与以往的研究一致。
与原发性亚克隆相比,Pt.3和Pt.4淋巴结中发现了新的亚克隆。L1淋巴结完全由一个新的亚克隆形成,L2淋巴结包含两个亚克隆:一个来自原发位点的亚克隆,另一个是一个新的亚克隆。淋巴结出现新的亚克隆的可能原因可能是原发部位的亚克隆全部转移到淋巴结,或者原发肿瘤中单个细胞测序有限。我们的研究没有比较GEJ癌和GC之间的单细胞CNV,因为迄今为止还没有GC的单细胞CNV数据。
我们的研究有几个优点。首先,首次采用单细胞基因组测序方法研究了GEJ癌的肿瘤异质性和淋巴结转移的克隆进化。第二,结合SNVs和CNVs进行分析,揭示淋巴结转移的可能机制。值得注意的是,这项研究有几个局限性。例如,被分析的病人和单个细胞的数量有限。进一步的研究将扩大GEJ癌症患者的数量和每个患者的单细胞。此外,还需要验证驱动突变基因的机制作用。
总之,我们的研究揭示了GEJ癌患者的SNV和单细胞CNV谱。通过SNV和CNV水平揭示了淋巴结转移的模式。这些发现将有助于我们更好地理解淋巴结转移的基因组变异和机制。