一个中国并发癌症家系的全外显子组测序研究

  • PMID: 31452746
  • PMCID: PMC6676670
  • DOI: 10.3892/ol.2019.10573

摘要

癌症是中国的主要死亡原因之一,并且由于其发病率和死亡率不断上升,对公众健康构成威胁。并发癌症定义为同一个体的一个或多个器官同时或连续发生≥2个原发性恶性肿瘤;然而,并发病例很少见,而且研究很少。本研究招募了一个呈现多例并发癌症病例的中国家庭,并对一个未受影响的个体和两个受影响的个体进行了全外显子组测序,以确定致病突变。从外周血和肿瘤组织样本中提取 DNA。在外显子组捕获和质量测试之后,合格的文库在 Ion Torrent 平台上被测序为 100 bp 双末端读数。通过过滤掉低质量的读数获得干净的数据。随后,使用干净的数据进行生物信息学分析。在千人基因组计划数据库、现有SNP数据库和Cancer Gene Census (CGC)数据库中作图和注释后,发现NADH:泛素酮氧化还原酶核心亚基S7基因是具有体细胞突变的候选基因,16个基因的子集是具有生殖线突变的候选基因。本研究的结果可能会提高对并发癌症分子发病机制的理解。

关键词:全外显子组测序,并发癌症,体细胞突变,NADH:泛醌氧化还原酶核心亚基S7基因,种系突变


介绍

癌症是一种对全世界人类健康构成威胁的疾病,已成为中国的主要公共卫生问题(1、2)。通常,癌症可能是由控制新生肿瘤内细胞存活、生长、增殖和分化的基因中分子改变的积累引起的 ( 3 )。目前,使用基因测序技术和先进的分析方法可以有效地评估癌症的分子谱 ( 4 )。技术进步提供了前所未有的速度和分辨率,可以在患者基因组中发现癌症发展和进展的致病突变,范围从点突变到染色体易位 ( 4 , 5)。特别是,肿瘤细胞基因组特有的体细胞改变和已知的特定遗传或“种系”基因组改变会增加对癌症发展的易感性 ( 4 , 5 )。并发癌症很少见,会增加家庭和社会的经济负担。然而,并发癌症发展和进展的分子机制仍不清楚。

下一代测序 (NGS),也称为高通量并行测序技术,为检查疾病的分子发病机制提供了一种公正的方法,并扩大了基因组分析在生物医学研究中的影响( 6、7 ) 。此外,NGS 已广泛用于科学研究以及癌症的临床诊断和治疗( 8-11 )。外显子组仅占人类基因组的约 2%,但包含约 85% 的已知疾病相关变异,这使得全外显子组测序 (WES) 成为全基因组测序 (WGS) 的重要替代方案 ( 12 , 13 ))。与 WGS 相比,WES 具有显着优势,包括降低成本、更快的数据分析和更容易的数据管理 ( 13 )。因此,使用 WES 技术研究并发癌症的分子变化是一种更具成本效益的方法。

在本研究中,WES 技术被用于识别一个中国家庭中的致病变异,其中两名成员被诊断出患有并发癌症。在过滤原始数据和详尽注释后,确定 NADH:泛醌氧化还原酶核心亚基 S7 ( NDUFS7 ) 是具有体细胞突变 (g.1391151G>A 和 g.1393289G>C) 的候选基因,是 16 个子集基因是同时患有癌症的患者中具有种系改变的候选基因。本研究结果可能会提高目前对并发癌症分子机制的认识,为进一步研究提供依据。


材料和方法

患者和样本

在本研究中,使用以下标准确定患有并发癌症的患者:ii) 每个肿瘤都是不同的;iii) 根据病理学和免疫组织化学分析,排除了一个肿瘤从另一个转移的可能性 ( 14 )。本研究检查了来自一个家庭的两名同时患有癌症的患者的外周血样本和肿瘤组织。在切除期间获得肿瘤组织(> 200 mg),放入冷冻保存管中并立即放入液氮或-80°C冰箱中。还收集了来自未受影响的家庭成员的外周血样本(5 ml)(表一)。所有患者均于 2014 年 12 月至 2017 年 1 月在宜昌市第二人民医院(中国湖北)招募。实验在每位患者的理解下进行,所有患者均签署书面知情同意书。本研究是根据《赫尔辛基宣言》世界医学协会伦理守则 ( 15 ) 进行的。本研究经三峡大学宜昌市第二人民医院医学伦理委员会批准。

表1

肿瘤组织的苏木精和伊红 (H&E) 染色

每个组织样本在 4°C 下固定在 10% 甲醛中过夜,然后嵌入 (FFPE) 石蜡中。FFPE 组织块在室温下用切片机切成 4 µm 切片,然后固定在标准玻璃组织学载玻片上。每个切片在二甲苯中脱蜡,通过分级乙醇再水化并在室温下进行 H&E 染色。每个切片用苏木精孵育 5-10 分钟,然后用曙红孵育 1 分钟。然后用 Pertex 封固剂将盖玻片添加到每张载玻片上。在 Olympus 光学显微镜上以 ×100 或 ×200 的放大倍数扫描染色的载玻片。所有样本在收到之前均已匿名。所有 H&E 染色切片均由两名病理学家检查。

DNA提取、文库制备和测序

根据制造商的方案,使用 QIAamp DNA Mini 试剂盒 (Qiagen GmbH) 从外周血和肿瘤组织样品中提取 DNA。为了构建文库,我们按照制造商的方案使用 Agilent SureSelect Human All ExonV5 试剂盒(Agilent Technologies, Inc.)进行外显子组捕获。每个样品总共使用 0.5 µg DNA 作为 DNA 文库制备的输入材料。基因组 DNA 样品通过超声破碎至约 350 bp 的大小(占空因数 10%,峰值入射功率 175,每次突发循环 200,处理时间 180 秒,浴温 4-8°C)。接下来,将 DNA 片段末端抛光、加 A 尾并与全长接头连接以进行测序,然后使用 KAPA HiFi HotStart ReadyMix (Roche Diagnostics) 进行进一步的聚合酶链反应 (PCR) 扩增。引物基于 P5 和 P7 流动池序列,适用于扩增使用全长接头制备的文库。引物序列如下: P5:5'-AATGATACGGCGACCACCGAGATC-3';P7:5'-CAAGCAGAAGACGGCATACGA-3'。热循环条件:98°C 初始变性 45 秒,98°C 变性 15 秒,60°C 退火 30 秒,72°C 延伸 30 秒,文库扩增 3 个循环,最终延伸72°C 1 分钟并保持在 4°C。随后,PCR 产物通过 AMPure XP 系统 (Beckman Coulter, Inc.) 进行纯化,通过 Agilent2100 Bioanalyzer (Agilent Technologies, Inc.) 分析文库的大小分布,并使用 KAPA 文库定量试剂盒通过定量 PCR (3 nM) 进行定量 (罗氏诊断)根据制造商的协议。引物与扩增程序相同。热循环条件如下:在 95°C 初始变性 5 分钟,然后在 95°C 变性 30 秒和 60°C 45 秒的联合退火/延伸的 35 个循环。同时扩增共 6 个预稀释 DNA 标准品和适当稀释的 NGS 文库。将每个 DNA 标准的平均 Cq 值与其已知浓度作图以生成标准曲线。标准曲线用于将稀释文库的平均 Cq 值转换为浓度,从中计算每个文库的工作浓度。质量测试后,合格的文库在 Ion Torrent 平台(Applied Biosystems;Thermo Fisher Scientific,Inc.)上根据制造商的 100 bp 双末端读数进行测序。

生物信息学分析

首先,过滤低质量reads后得到干净的数据,包括adapter序列的reads、N>10%比例的reads和低质量碱基数>5的reads。采用 Burrows-Wheeler 变换方法将这些读数映射到加利福尼亚大学圣克鲁斯分校 (UCSC) hg19 ( 16 , 17 ) 的人类参考基因组。随后,Picard 和基因组分析工具包(GATK;3.2 版)方法被用于重复去除、局部重新排列和碱基质量重新校准,如前所述 ( 18 , 19)。最后,使用 GATK Unified Genotyper 软件(3.0 版;Broad Institute)进行 SNV 注释。QualByDepth (QD) 的值描述了每单位深度的变化质量,QD 越高,总体上变化的可靠性越高 ( 20 )。QD >2.0 设置为“良好”SNV (FILTER=Pass),这可以很好地区分可靠和不可靠的变化。

使用 ANNOVAR 软件工具 ( 21 ) 对变体进行注释。功能注释(外显子、内含子和非翻译区)、参考基因、外显子功能(同义、非同义、停止增益、移码和未知)、氨基酸变化、1,000 Genomes Project 数据库 ( 22 )、单核苷酸多态性数据库 ( dbsnp 138;ftp ://ftp-trace.ncbi.nih.gov/snp/organisms/ ) 和癌症基因普查 (CGC) 数据库 ( 23 )。Varscan2 (VarScan.v2.3.9; http://varscan.sourceforge.net/ ) ( 24 ) 用于鉴定来自两名并发癌症患者的四对肿瘤组织和外周血样本中的体细胞突变。

WES 生成了大量数据,并对数据集应用了几个过滤标准。首先,给定碱基的测序质量得分 Q 由以下等式定义: Q=-10log10(e) 其中 e 是碱基调用错误的估计概率。20 分的质量分数代表 100 分之一的错误率,相应的调用准确率为 99%。删除了低质量分数(<20)的变体。其次,千人基因组试点项目数据库存储来自正常人的数据。次要等位基因频率 (MAF) 是群体中相对罕见的等位基因的百分比。每个位置的每个变化都有一个 MAF 值。MAF=1%一般作为判断与疾病相关性的分界线,但不是绝对值。重要的,阈值必须结合疾病发生率进行分析。并发癌症很少见;因此,报告的 MAF > 0.005 的变体被过滤掉。然后,同义变化被删除,只分析了改变蛋白质的变体。


结果

血统描述

并发癌症的患者来自中国湖北。总共招募了两名受影响的个体(II-1 和 II-5)和一名未受影响的个体(II-3)(图。1)。先证者(II-1)是一名68岁的女性,根据美国国家综合癌症网络指南和pTNM分期系统,乳腺癌的病理肿瘤-结节-转移(pTNM)阶段为pT2N2M0,直肠癌为IIIA阶段(pTNM阶段,pT4N0M0)。( 25 – 27 )。先证者的弟弟 (II-5) 是一名 61 岁的并发癌症患者,患有肝癌 (pT3N0M0) 和 IIIA 期淋巴瘤 ( 28 , 29 )。家中 2 例并发癌症病例均在医院进行组织学确诊(30例),采集其肿瘤组织和外周血样本进行 WES(图 2)。此外,从一名健康的家庭成员(II-3),一名 63 岁的男性中采集外周血,并在本研究中对其外显子组进行了测序。

图1 家族谱系图。圆圈和方框分别代表女性和男性。黑色方块或圆圈代表被诊断患有癌症的患者,而白色方块或圆圈代表没有癌症的个体。收集来自家族成员 II-1、II-3 和 II-5 的样本用于全外显子组测序。

图2 来自患者 II-1 和 II-5 的肿瘤组织的苏木精和伊红染色切片的图像。(A) pT2N2M0 期患者 II-1 的乳腺癌组织。放大倍数,×100。(B) pT4N0M0 期患者 II-1 的直肠癌组织。放大倍数,×100。(C) pT3N0M0 期患者 II-5 的肝癌组织。放大倍数,×200。(D) IIIA 期患者 II-5 的淋巴瘤组织。放大倍数,×100。P,病理;T,肿瘤;N,节点;M,转移。

WES

为了研究并发癌症的分子发病机制,对两个受影响个体(II-1 和 II-5)和一个未受影响个体(II-3)的外显子组进行了测序。大量的原始数据被生成并进一步分析(图 3)。所有碱基的质量得分均 > 20,这确保了以下分析的可靠性 ( 31 )。通过应用上述过滤过程来获得干净的数据。在映射到人类参考基因组 UCSC hg19 ( 17 )、局部重新比对和碱基质量重新校准后,获得了每个目标碱基平均 58X 深度的有效外显子序列和 ≥82.08% 覆盖 >10X 的外显子位置 (表二)。一个未受影响(II-3)和两个受影响个体(II-1 和 II-5)的七个样本中的转换/颠换比率在 2.2 和 2.4 之间(表三)。

图3 数据分析的工作流程。BAM,二进制对齐图;SNP,单核苷酸多态性;QC,质量控制。

表2 平均覆盖率和覆盖率 > 10X 的外显子位置百分比。

表3 七个样本中的转换/颠换比率。

体细胞突变

Varscan2 ( 32 ) 用于鉴定来自两名并发癌症患者的四对肿瘤组织和外周血样本中的体细胞突变:i) BT15061701HNDQ 和 BT15082203HNDE;ii) BT15061702HNDQ 和 BT15082203HNDE;iii) BT15061703HNDQ 和 BT15082201HNDE;iv) BT15061704HNDQ 和 BT15082201HNDE (图 4)。在检测和注释体细胞 SNV 之后,本研究侧重于外显子区域或剪接位点的错义变异。此外,在 1,000 Genomes Pilot Project 数据中报告频率 >0.005 的变体被删除 ( 22 )。结果,从患者 II-1 中检测到乳腺肿瘤组织中 1,771 个基因中的 2,053 个体细胞突变和直肠肿瘤组织中 420 个基因中的 467 个体细胞突变。对交叉的进一步分析表明,患者 II-1 的两种肿瘤组织中同时发生了三个基因的五个体细胞突变。表四)。同样,在患者 II-5 的两种肿瘤组织中,三个基因中的七个体细胞突变同时发生。表五)。其中,NDUFS7在两名并发癌症患者中作为具有体细胞突变(g.1391151G>A和g.1393289G>C)的候选基因出现。表六)。NDUFS7(g.1391151G>A和g.1393289G>C)在乳腺癌和肝癌中为纯合子,而在直肠癌和淋巴瘤中为杂合子。

图4 识别体细胞突变的工作流程。SNV为单核苷酸变异。

表4 在患者 II-1 的两种肿瘤组织中鉴定出体细胞突变。CDC27,细胞分裂周期 27;LDHAL6B,乳酸脱氢酶 A,如 6B;NDUFS7,NADH:泛醌氧化还原酶核心亚基 S7。

表5 在患者 II-5 的两种肿瘤组织中鉴定出体细胞突变。NDUFS7,NADH:泛醌氧化还原酶核心亚基 S7;NDUFS8,NADH:泛醌氧化还原酶核心亚基 S8;SDHB , 琥珀酸脱氢酶复合铁硫亚基 B.

表6 NDUFS7是在两名同时患有癌症的患者中具有体细胞突变的候选基因。NDUFS7,NADH:泛醌氧化还原酶核心亚基 S7。

种系突变

为了进一步研究并发癌症的分子发病机制,使用 GATK 方法分析了种系突变。图 5)。选择了两个受影响个体(BT15082201HNDE 和 BT15082203HNDE)共享但未受影响个体(BT15082202HNDE)中不存在的外周血样本中的变体。同样,本研究仅关注外显子区域或剪接位点的错义变异,并在 1,000 Genomes Pilot Project 数据中过滤掉报告频率 > 0.005 的变异。结果,在 145 个候选基因中检测到 183 个错义 SNV。随后,这些候选 SNV 被进一步映射到 CGC 数据库,以检查可能的种系突变和基因 ( 33 )。最后,16 个基因中的 17 个 SNV 成为并发癌症患者的候选种系突变。表七)。

图5 鉴定种系突变的工作流程。选择了两个受影响个体(BT15082201HNDE 和 BT15082203HNDE)共享但未受影响个体(BT15082202HNDE)中不存在的外周血样本中的变体。CGC,癌症基因普查;GATK,基因组分析工具包。

表7 两名并发癌症患者的候选种系突变。ASCC1,激活信号协整器 1 复合亚基 1;CCDC117,卷曲螺旋结构域,包含 117;CNTRL,中心蛋白;COL6A3,VI型胶原α3链;EPPK1,表观白蛋白 1;KIF1A,驱动蛋白家族成员 1A;NPIPB6,核孔复合物相互作用蛋白家族成员B6;OR8U1,嗅觉受体家族 8 亚家族 U 成员 1;PABPC3,poly(A) 结合蛋白胞质 3;PEAR1,血小板内皮聚集受体 1;PGLYRP4,肽聚糖识别蛋白4;RAB36,RAB36 成员 RAS 癌基因家族;SSPO, SCO-spondin; ZDHHC21,锌指DHHC型含21;ZNF141,锌指蛋白 141;ZNF717,锌指蛋白 717。

本研究调查了并发癌症的分子改变。通过对一个患有并发癌症的中国家庭中两名受影响个体和一名未受影响个体的外显子组进行测序,本研究将NDUFS7确定为具有体细胞突变(g.1391151G>A 和 g.1393289G>C)的候选基因,以及 17 个 SNVs 16 个基因作为候选种系突变。目前的结果为分子水平上并发癌症的致病改变提供了见解。


讨论

了解癌症发展和进展的致病突变是癌症研究的一个持续目标。受孕后,体细胞突变可以发生在身体的任何非生殖细胞中,而生殖细胞突变是从父母那里遗传的 ( 4 , 5 )。在过去的几十年中,科学家们做出了全面的努力来提高分辨率并降低测序方法的成本。人类癌症常见形式的基因组图谱已经确定 ( 34 – 36 )。然而,并发癌症的分子机制仍然未知。目前,没有治疗并发癌症的具体方法。并发癌症患者的治疗与其他常见的人类癌症一样。

随着时间的推移,肿瘤通过获得一系列突变而从良性病变演变为恶性病变。发生在肿瘤细胞基因组中的体细胞突变在癌症发展中起着至关重要的作用,包括肿瘤发生的开始。在常见的实体瘤中,包括来自乳腺、结肠、脑或胰腺的实体瘤,平均有 33-66 个基因可能显示出细微的体细胞突变,这些突变预计会改变蛋白质产物 ( 5 )。在这些突变中,约 95% 是单碱基替换,其中 90.7% 导致错义变化,7.6% 导致无义变化,1.7% 导致与起始和终止密码子相邻的剪接位点或非翻译区域发生变化 ( 5 ) . 在本研究中,NDUFS7在并发癌症的情况下,它成为具有体细胞突变的候选基因。NDUFS7基因编码一种蛋白质,它是线粒体呼吸链中复合物 I 的一个亚基 ( 37 )。由于线粒体复合物 I 缺乏,该基因的突变会导致 Leigh 综合征 ( 38 , 39 )。Leigh 综合征是一种严重的神经系统疾病,会导致大脑皮质下区域出现双侧对称的坏死病变 ( 38 , 39 )。据我们所知,本研究是第一个将NDUFS7鉴定为并发癌症中的体细胞突变基因的研究。需要进一步的研究来验证NDUFS7中的这些体细胞突变如何基因可能导致与癌症发展相关的功能改变。

从父母那里遗传的种系突变会增加患癌症的易感性 ( 4 , 5 )。对患者生殖系基因组成分的评估可能会提高目前对各种癌症发病机制的理解。本研究在并发癌症患者的外周血样本中鉴定出 16 个候选基因中共有 17 个种系突变,包括肽聚糖识别蛋白 4、血小板内皮聚集受体 1 ( PEAR1 )、VI 型胶原α3 链、驱动蛋白家族成员 1A , 锌指蛋白 717 ( ZNF717 ), 锌指蛋白 141 ( ZNF141 ), SCO-spondin, epiplakin 1, 含锌指 DHHC 型 21 ( ZDHHC21)、中心蛋白、激活信号协整因子 1 复合亚基 1、嗅觉受体家族 8 亚家族 U 成员 1、poly(A) 结合蛋白细胞质 3、核孔复合物相互作用蛋白家族成员 B6、RAB36 成员 RAS 癌基因家族和含有卷曲螺旋结构域117 个基因。在映射到 CGC 数据库后,发现这些基因中的突变先前已被报道与癌症进展有关。例如,ZDHHC21基因的突变在直肠癌中被报道,但在乳腺癌中没有,PEAR1、ZNF717ZNF141基因的突变在肝癌中被检测到,但在淋巴瘤中没有被检测到,正如癌症体细胞突变目录所评估的那样( 40 – 42)。值得注意的是,据我们所知,本研究首次表明这些基因的突变可能会增加对并发癌症的易感性。

总之,本研究的重点是一个罕见的三代家族病例,其中两名成员同时患上癌症。通过WES和生物信息学分析,在NDUFS7基因中鉴定出可能的体细胞突变,在16个候选基因中鉴定出种系突变。尽管需要进一步的研究来验证这些变体,但据我们所知,本研究的结果首次提出了与并发癌症相关的特定分子谱。


你可能感兴趣的:(一个中国并发癌症家系的全外显子组测序研究)