【文献】对人类癌症中HPV整合的全基因组分析揭示了复发性局灶性基因组不稳定

image.png

研究背景:

人类乳头瘤病毒(HPV)每年在全世界范围内引起610,000例癌症(Forman等,2012)。具有里程碑意义的研究表明,HPV是几乎所有子宫颈癌(Walboomers等,1999)以及其他肛门生殖器和头颈癌的子集(Gillison等,2000; IARC对人类致癌风险评估的工作组,2007)的主要原因。 )。尤其是与HPV相关的头颈部鳞状细胞癌(HNSCC)的发病率正在以惊人的速度增加(Chaturvedi et al。2011)。致癌型HPV类型的转化能力归因于两种病毒癌蛋白E6和E7,它们分别使p53和pRb家族成员失活(Moody和Laimins 2010)。 E6和E7表达对于病毒生命周期至关重要,因为HPV选择了细胞DNA复制机制。尽管它们的表达足以在体外使细胞永生化(Hawley-Nelson等,1989; Munger等,1989),但是次生遗传事件对于体内癌症的发展是必需的(Moody and Laimins 2010)。感染早期,HPV基因组在核中复制为染色体外元件。病毒整合频率随宫颈癌的严重程度而增加,并且大多数宫颈癌中都存在病毒整合剂(Wentzensen等,2004; Xu等,2013)。整合通过增强病毒癌基因转录本的表达和稳定作用,既赋予了被感染细胞选择性的生长优势,又使基因组不稳定(Pett等人,2004)(Jeon and Lambert 1995)。转录的增加归因于病毒阻遏物HPV E2的频繁破坏(Thierry and Yaniv 1987)。宫颈癌中的HPV整合子与区域结构异常在统计学上相关(Peter等,2010),但病毒与此类变体之间的关系,其详细的基因组结构及其功能重要性仍然未知。 为了研究HPV整合对宿主基因组结构和功能的影响,我们进行了全基因组测序(WGS),RNA-seq,光谱核型分析(SKY),荧光原位杂交(FISH)和其他分子测定。我们选择了10种HPV阳性和阴性人类癌细胞系,因为它们提供了相对无限且实验上容易处理的基因组样本,代表了宫颈癌和头颈癌。我们以单核苷酸分辨率进行的全面,全基因组分析确定了HPV整合子与相邻基因组扩增和重排之间的显着反复关联。 WGS还证实,在原发性HPV阳性的头颈癌中,经常发生类似的HPV相关结构变异

材料:

作者使用HiSeq 2000平台(Illumina)对来自10个癌细胞系(两个子宫颈和八个头颈)和两个HPV16 / 18阳性原发性HNSCC(扁桃体和口腔)构建了的2 * 100 bp配对末端文库(进行WGS 基因组网络构建)。这些细胞系来自五个HPV16阳性(HMS001,UM-SCC-104,UD-SCC-2,UM-SCC-47,UPCI:SCC090)和三个HPV阴性(CAL 27,D562,SCC-25) HNSCC样本以及两种HPV16阳性(SiHa,CaSki)宫颈癌样本(表一)。

image.png

结果展示:

HPV基因组和转录组的变异性 在HPV阳性的病例中,大量的WGS reads都比对到了参考病毒基因组(图1A)但在HPV阴性的病例中没有。


image.png

其中在每一行中,蓝色代表病毒序列的拷贝数,红色代表支持病毒插入,病毒内(黄色)或两个(橙色)断点的不一致末端配对读数的计数。 8-kb病毒基因组的序列覆盖深度显示出可观的变异性(图1A)。在肿瘤B中发现了均匀的病毒覆盖。相反,其他八个HPV阳性样品的病毒基因组覆盖范围不均匀或缺失,促使我们寻找插入断点,即病毒和宿主基因组序列之间的连接点。断点调用基于两个或多个在500 bp间隔内与人类参考基因组对齐的不一致末端配对读数。在9例HPV阳性病例中,总共鉴定出111个独特的插入断点;每个样本的频率范围从2到47并且通过靶向PCR扩增和Sanger测序确认绝大多数的断点(95%; 111个样本中的105个)(补充表3)

**HPV breakpoints confirmed by PCR amplification and Sanger sequencing

image.png

总的来说,插入断点在HPV基因组中分布广泛(图1B)

image.png

验证插入断点。 根据HPV16基因组中的位置(x轴)显示支持在每个研究样本中鉴定的断点的reads支持数。 (黑点)通过PCR和Sanger测序确认; (红色)PCR失败; (蓝色)未测试; (LCR)长控制区; (OR)复制起点。

在几种情况下(例如SiHa,HMS001,UM-SCC-104和UM-SCC-47细胞),它们位于缺失的病毒片段的侧翼,表明整合时丢失。在9例病例中有4例缺少E2基因(图1A; Choo等,1987)。病毒基因组内的重排也导致UD-SCC-2,UPCI:SCC090,CaSki和肿瘤A中的病毒覆盖范围不均匀(补充图1)。尽管病毒基因组片段化范围广泛,但在所有样品中均保留了含有E6和E7癌基因的病毒片段。 由于检测HPV E6和E7转录本仍然是确定由HPV引起的癌症的金标准(Gillison and Shah 2003),因此在所有情况下,我们均使用RNA-seq评估了病毒基因的表达,但SiHa除外(仅由RACE评估)。所有病毒阳性病例均显示出强而可变的HPV转录物表达(补充图2)。


image.png

HPV E6 and E7 oncogene transcripts are expressed in diverse cancers. Depictions of transcript read counts (top panel, gray histograms) and splicing patterns (bottom panels, salmon pink and indigo "Sashimi plot" ribbons) from RNA-Seq data obtained from seven HPV16 positive and one HPV18-positive cancer samples, visualized by IGV (Thorvaldsdottir et al. 2012). Vertical colored lines: Positions of SNPs in homozygosity. Salmon pink, sense stranded transcripts; indigo, antiparallel transcripts. We did not obtain RNA-Seq data from SiHa cells. Bottom, red rectangles: Positions of HPV genes and long control region (LCR) including origin of replication (OR, red circle), shown with reference viral genome coordinates. Tumor A is HPV18-positive, where viral coordinates have been superimposed onto HPV16 genome coordinates.

非常经典的是,在所有HPV阳性病例下均发现了源自早期p97启动子剪接病毒转录本的情况,其编码能力为E6 * I和E7。

HPV和细胞基因组

WGS数据揭示了每个宿主细胞基因组样本中的数百万个SNP和插入/缺失(插入/缺失)多态性(补充图3)。


image.png

我们证实了HPV状态与TP53和CDKN2A中的失活突变之间存在负相关关系(Fisher精确,P = 0.004)(Gillison等,2000; Westra等,2008)。 在HNSCC中经常发生突变的基因中也检测到了突变,缺失或染色体易位,包括PTEN,PIK3CA,PIK3API,NOTCH1,TP63,SYNE1,SYNE2和CASP8(Agrawal等,2011; Stransky等,2011)。 在UM-SCC-104细胞中,NOTCH1中的纯合缺失导致其预期的移码和过早截断(补充表4)。 在七个HPV阳性HNSCC样本中的六个样本中发现了5p(增益)和3p26(损失)(Heselmeyer等人,1997)的重复染色体得失(补充图4、5)。


image.png

HPV整合的局部聚类 总的来说,HPV整合体广泛分布于整个人类基因组中。我们没有发现在染色体热点中反复整合的证据。但是,我们观察到HPV插入断点聚集在不同细胞系中的特定染色体区域(图2;补充图5)。 “簇”中病毒整合体之间的基因组距离,由三个或更多个唯一的插入断点定义,跨度最大为3 Mb(肿瘤A)。例如,HPV整合簇位于UD-SCC-2细胞中的Xq21染色体,UM-SCC-47细胞中的3p11染色体以及UPCI:SCC090细胞中的3p12、6p21和9q22染色体(图2)。

image.png

为了进一步检查HPV整合簇,我们在所有细胞系上均使用HPV16特异性探针进行了荧光原位杂交(FISH)和光谱核型分析(SKY)。进行了一些观察。确认了通过WGS鉴定的大多数整合簇的染色体位置(图2;补充图6)

image.png

,但未检测到低拷贝数的整合体(例如HMS001和UM-SCC-104)。在染色体发生duplication的区域发现了HPV FISH信号,但强度不同,这表明整合发生在染色体重复之前,随后是病毒拷贝数的差异。Chromosomal paints 和HPV FISH信号通常重叠,这与病毒和宿主基因组序列交替出现是一致的。结合FISH和SKY分析还经常发现与染色体易位相邻的HPV整合体。尽管从WGS数据也观察到了这些整合体,但在某些情况下,HPV插入和易位之间的物理距离超过1 Mb。

PV插入的侧翼拷贝数变异(CNV) 在某些情况下,通过WGS检测到的HPV插入断点数量少于病毒拷贝数。我们假设这种差异是由于病毒整合蛋白和侧翼基因组序列的扩增所致,导致了冗余的相同断点(图3)。

image.png

因此,我们检查了包含HPV整合子的染色体区域的WGS覆盖率。在9例HPV阳性病例中,有8例在这些整合位点观察到广泛的局灶性基因组CNV。病毒整合位点(图3,红色直方图)直接位于WGS覆盖深度的深度波动范围内或附近。在扩增区域(蓝色组织图)发现了HPV整合子,范围从HMS001增加了1.5倍,到UPCI:SCC090细胞增加了58倍(补充图7、8;补充表5)。

image.png

病毒整合体也位于其中发生缺失的区域的侧面(图3,黄色),范围从HMS001的487 bp(图4B)到UPCI:SCC090的3号染色体的234 kb。

image.png

只有UM-SCC-104细胞缺少位于单独的HPV整合体两侧的CNV(图3G)。

image.png

我们通过定量PCR测定法确认了扩增区域(补充图8),并通过跨越PCR和Sanger测序证实了缺失区域。

统计分析证实,在9例病例中有8例中HPV插入断点与基因组结构变异之间有很强的联系,包括染色体易位,失调,倒位和/或染色体内重排(Bonferroni调整的二项式检验,所有P <109)(补充图7)。而且,这种富集发生在九个样品中的六个中的局灶性高扩增位点(局部倍性> 8N,Bonferroni调整的二项式检验,所有P <10×10)。在携带低拷贝数或主要是未整合的病毒基因组(即UM-SCC-104,HMS001和肿瘤B)的样本中,未观察到HPV整合子与局灶性超扩增(> 8N)之间的这种统计关联。

解决焦点基因组扩增和重排 我们试图阐明在HPV插入位点两侧的实际线性DNA结构。在从WGS数据调用的断点和CNV的指导下(图3),我们进行了有针对性的PCR,Sanger测序和染色体游走以建立连接图(图4-6)。

image.png

在七个HPV阳性细胞系中的六个中,发现了与HPV整合位点相邻的局灶性扩增和重排的复发模式(图4、5)。在SiHa细胞中,两个插入断点直接位于一个两倍扩增的300 kb片段的侧面(图3A,4A,红线)。尽管在参考基因组中相距300 kb,Sanger靶向Sanger测序证实这两个断点由7 kb HPV16基因组序列连接(图4A,红线)。这种HPV介导的重排发生了两次,将大型的侧翼基因组片段从头到尾连接在一起,并导致了两个HPV整合受相同的断点限制。在重复的片段之一中,二次重排导致; 72kb内部缺失。 在HMS001细胞中,有两个病毒插入断点描绘了跨越小基因组缺失的HPV16整合体(图4B)。串联复制相邻的宿主基因组片段和病毒序列,从而导致两个相同的HPV整合子和染色体内重排。

image.png

与HPV整合位点相邻的这些相对简单,可分辨的线性基因组结构促使我们构建了一个“循环”模型来解释它们的发生(图4C)。我们假设HPV整合子可以桥接不连续的基因组序列,也许可以通过连接有缺口的位点来实现。我们还推测瞬时的,环化的基因组片段的复制会导致涉及病毒和侧翼宿主基因组序列的断点的局部扩增。随后,扩增链的远端自由端可以与不连续的序列重组并进行抗原修复,从而导致以重复的相同断裂点为边界的串联线性结构(图4C)。

image.png

在除一种HPV阳性细胞系中,其他所有宿主病毒序列均显示出明显一致的模式(图3-6)。 UM-SCC-47和UD-SCC-2细胞系以及UPCI:SCC090的染色体6和9在HPV整合簇上解析的线性DNA结构比SiHa和HMS001细胞复杂得多(图4、5;补充图9)。然而,在每个样品中发现了由相同的HPV整合子(红线)和/或宿主-宿主重组断点(灰色线)连接的基因组扩增和重排。还鉴定了HPV相关的基因组缺失(UD-SCC-2)和倒位(UM-SCC-47,UD-SCC-2,UPCI:SCC090)(图5;图5)。

image.png

补充图9)。值得注意的是,在大多数研究样本中,病毒E6和E7癌基因在病毒-宿主串联体中被扩增。 例如,在UM-SCC-47细胞中的TP63位点(图3C,5A),我们观察到了五个插入断点来划分四个独特的HPV整合体。与我们的循环模型一致,病毒整合物桥接了不连续的宿主序列(图5A,区段B和F),该序列被扩增,从而在串联阵列中产生总共25个HPV整合物。 在UD-SCC-2细胞中,HPV介导的基因组扩增侧接了> 100 kb的缺失(图3D;补充图9A)。

image.png
image.png

DIAPH2基因的某些外显子被扩增(例如,段K–S),而其他外显子则被删除(段J)。在UPCI:SCC090细胞中,15个HPV插入断点聚集在9号染色体上(图3E;补充图9),


image.png
image.png

五个聚集在6号染色体上(图3F,5B)。 9号染色体上的几个整合子共享相同的59个断点,但连接到唯一的39个断点(补充图9B)。共有的59个断点再次与我们的循环模型一致(图4C),由此,原代HPV整合子的39个末端随后可以在多个上游基因组位点重组。我们还观察到由另一个HPV整合子桥接的宿主DNA的> 90倍扩增。这些结果证实了环化可能发生在同一细胞中的多个染色体上。在CaSki细胞中的许多HPV整合簇中也存在类似的扩增,缺失和倒置(补充图5、6)。 为了排除观察到的HPV整合子和侧翼基因组变异之间的关联(图3-5)仅仅是细胞培养物的可能性,我们还通过WGS评估了两种原发性人类肿瘤。在肿瘤A中,第5号染色体上的插入断点簇包括与HPV-18相关的缺失,倒位和扩增(图6A–C)。所涉及的基因座的长度为2 Mb,破坏了包括ACTBL2和候选癌基因PDE4D在内的几个基因的基因组结构(Lin等人,2013)。

image.png

在主要携带游离型HPV的肿瘤B中,WGS表明HPV16的小片段直接整合到染色体易位中间,并列在染色体11q13(直接涉及CCND1,编码细胞周期蛋白D1)和染色体8p11之间(图6D -F)。

image.png

我们发现了几个插入点和宿主-宿主断点,它们跨越11号染色体上的2-Mb段,而8号染色体上的近5 Mb片段,支持了染色体之间交织的一系列连接,这再次与我们的循环模型一致。基于WGS序列覆盖率和估计的染色体倍性,我们推断HPV序列连接了两个染色体的片段,导致明显的双着丝粒易位t(11; 8)和单体染色体8和11(图6E,F)。 重要的是,对来自21个其他HPV阳性HNSCC原发性肿瘤的WGS数据的初步分析表明,大约一半的人拥有CNV,重排直接与HPV插入断点相接。

HPV整合子通过多种机制破坏细胞基因

在九种HPV阳性细胞系和肿瘤中评估了HPV整合子可能在细胞基因内或附近富集的可能性。使用NCBI RefSeq基因作为参考,已确认的断点将59(12.6%)或39(15.3%)映射到基因,外显子(2.7%),内含子(39.6%)或基因间基因座(29.7%)中。我们在RefSeq基因的50 kb(二项式检验,P值= 0.063),基因组脆性位点(二项式检验,P值= 0.02)或DNase I超敏性位点(二项式)中观察到HPV整合蛋白的适度富集。测试,P值= 0.003)。但是,在考虑了整体集群的相互依赖性之后,这些关联不再是重要的(补充表6)。 通过RNA-seq以及59和39个RACE实验进行的基因表达分析揭示了病毒-宿主融合转录本在所有细胞系和肿瘤A中的表达。从病毒早期区域启动子(p97,p670)启动的转录本直接与或融合在一起进行了剪接与基因组模板。在SiHa,UPCI:SCC090和UD-SCC-2细胞中,病毒融合转录本从一个簇中的多个整合子表达。重要的是,转录物结构经常确认通过WGS和Sanger测序发现的基因组重排(图7)。

image.png

许多插入断点侧翼或破坏了与致癌作用有关的基因(补充表7)。例如,UD-SCC-2细胞中的HPV整合子缺失并重排了DIAPH2的部分(图7A–E),该蛋白质编码一种参与姐妹染色单体分离保真度的蛋白质(DeWard等,2010; Cheng等。 2011)。缺失侧翼的病毒-宿主融合转录本表达强烈,而天然DIAPH2转录本则不表达。如Western印迹所示,UD-SCC-2细胞系中不存在由DIAPH2编码的蛋白质,即透照相关的甲蛋2。 在另一种基因破坏形式中,HPV介导的UM-SCC-47细胞中的基因扩增导致TP63异常表达,TP63是上皮分化的关键调节因子(图7F–I; Bergholz和Xiao 2012)。表达了几种截然不同的病毒-宿主融合产物,以及在TP63羧基末端截短的25kDa新型蛋白质。截短的蛋白包括TID结构域,TID结构域是促凋亡蛋白TAp63的显性负调节剂(Serber等,2002)。 发现了基因破坏的其他例子(补充图10、11)。这些包括由HPV相关的环状结构导致的UPCI:SCC090细胞中癌基因FOXE1(Katoh等,2013)和PIM1(Narlik-Grassow等,2013)的扩增。我们还发现了“基因破坏”(Wheelan等,2005)是由于HPV E5聚腺苷酸化位点的转录物过早终止所致。

总结:
作者通过多种方法分析发现,异常的HPV“looping(成环)”可在人乳头瘤病毒DNA插入位点引起宿主染色体的特殊损伤。

你可能感兴趣的:(【文献】对人类癌症中HPV整合的全基因组分析揭示了复发性局灶性基因组不稳定)