生信分析 Nature|染色体外环状DNA与癌症的相关性分析

要说2020年遗传与生物信息领域最热门的话题之一那必定是染色体外环状DNA了。不仅是BioRxiv上不断增多的相关内容,更有从年初几篇发在高分期刊的环状DNA文章,到年末频频发表的生信流程和软件。染色体外环状DNA的研究正在吸引越来越多的科学家和生信工作者。那么今天我们一起来分享其中一项具有代表性的研究:染色体外环状DNA与癌症的相关性分析。该研究于2020年8月发表于Nature Genetics (IF:27+)。基于生信分析的工作要发到Nature Genetics级别的期刊并不容易,但有热点加持,会如虎添翼。(生信人)

染色体外环状DNA与多种癌症中致癌基因的扩增及预后不良呈相关性


主要方法

AmpliconArchitect

本文的研究结果基于生物信息流程AmpliconArchitect。AmpliconArchitect可以用来识别扩增子的结构,要求是扩增子片段大于10 kb且比多倍体中位拷贝数多4拷贝。AmpliconArchitect的输入文件是WGS序列的比对结果和候选扩增子的seed区间。AmpliconArchitect 利用这些信息来搜索不同的扩增子,并且确定其拷贝数以及能够支持断点的序列比对。区间和断点的集合可以用来构建图形,节点代表片段,边缘代表重组。该断点图形可以进一步分解成简单或复杂的环形,用来检测扩增子的结构起源。AmpliconArchitect会首先掩盖基因组中的重复片段,包括着丝粒和着丝粒周围的区域。从而使这些片段不构成扩增子的一部分。因而AmpliconArchitect只检测着丝粒之外的区域。检测到的扩增子利用Ensembl (release 75)的数据库GRCh37进行注释。

扩增子和样本的分类

正如AmpliconArchitect的前提条件,扩增子必须大于10 kb且比多倍体中位数多4拷贝。作者进一步利用断点图形来将扩增子分类为4类:(1)环状扩增;(2)BFB扩增;(3)大量重组的扩增;(4)线性扩增。分类标准如图1a所示。

数据来源

本文通过Systems Biology Cancer Genomics Cloud (ISB-CGC; https://isb-cgc.appspot. com/)云计算平台进行TCGA数据分析。作者利用AmpliconArchitect分析了来自1921患者的3731 BAM 文件。分析过程采用AmpliconArchitect的默认参数,具体流程可见之前发表的相关论文(Deshpande,2019,Nat. Commun) 。PCAWG WGS BAM文件来源于Amazon 云计算平台。AmpliconArchitect分析了来自1291患者的WGS肿瘤数据。

统计分析

本文所有数据分析利用R v3.3.2和python v2.7.11 或者 v3.5.4。存活曲线用Kaplan–Meier 的方法估计得出,不同组之间存活曲线的比较通过R软件包“survival”v.3.1.11中的log-rank检测得出。风险率是由“survival”软件包中的Cox比例风险回归模型估计得出。

本文围绕癌症病人全基因组生物信息分析展开。我们知道,染色体外环状DNA能够促进肿瘤遗传信息的特异性,并且加剧肿瘤的进化,但其在临床方面的影响还尚不清楚。本文通过对3212位癌症病人全基因组的生物信息计算分析发现染色体外环状DNA在大多数癌症类型中均有扩增。并且许多致癌基因在染色体外DNA上得到复制。这使得相比于线性DNA,染色体外环状DNA造成致癌基因过表达的特征。本文作者还发现,这些携带大量染色体外环状DNA的病人存活期相对较短。该研究表明,不同于染色体线性DNA,基于染色体外环状DNA的致癌基因复制在癌症中十分常见。本文不仅通过泛癌症全基因组分析揭示了染色体外环状DNA与癌症的关系,同时还开发了一款生物信息软件AmpliconArchitect用来检测基因组中扩增子的结构。

本文主要的结果:

本文开头定义了研究对象染色体外DNA(Extrachromosomal DNA, 简称ecDNA)的特征:(1)ecDNA是环状的;(2)它们具有高拷贝数;(3)它们缺少中心粒。基于这些特征,作者开发了一款叫做AmpliconArchitect的工具。AmpliconArchitect可以通过WGS数据检测基因组中的ecDNA。作者用这款工具分析了肿瘤的WGS数据,以及相应的正常组织的数据和血液WGS数据。数据来源为TCGA和PCAWG两个数据库。检测到的扩增子被分为四种类型:(1)环状,多为染色体外DNA所造成的扩增;(2)BFB,指由“breakage-fusion-bridge”机制所产生的复制;(3)重组,主要指这些扩增子中含有不同染色体或距离大于1Mb的DNA片段;(4)线性,证明该扩增子由线性DNA扩增而产生(图1a)。

图1,利用AmpliconArchitect检测出的扩增子结构和特点分类


为了证实AmpliconArchitect的分析效果,作者利用FISH探针检测了细胞核外的扩增子,并观察到85%的扩增子可被归纳为环状,从而证实了该方法的有效性。同时,为了验证患者肿瘤中扩增子分类的准确性,作者用该方法分析了15个神经细胞瘤的数据,并通过对比基于CIRCLE-seq的分析结果证实了该方法可以有效地区分环状DNA和线性DNA (图1b)。

方法有效性得到证实后,作者用该方法分析了3212肿瘤WGS数据和1810非肿瘤数据。结果显示460(14.3%)肿瘤样本中存在1或多个环状扩增子,这说明基于染色体外环状DNA的扩增在肿瘤间十分常见。相比之下,环状扩增子在正常组织中和血液样本中几乎无法被检测到。并且,在29种癌症中,有25种可以检测到环状DNA。这些结果说明,染色体外环状DNA的扩增在癌症中很常见,但在正常细胞中并不常见 (图1c)。

作者发现,579个环状扩增子的染色体分布是非随机的(图2a),在24个最常扩增的致癌基因中,38%在环状扩增子中存在 (图2b)。同时,在多于5个样本中扩增的致癌基因中(1804)有21.8% 属于环状结构。对于多拷贝致癌基因(拷贝数大于8),该比例上升至53%。而且通过环状扩增子扩增的致癌基因比起在线性染色体上扩增的致癌基因拥有更多的拷贝数。作者进一步发现,环状结构和致癌基因的相关性并未拓展到断点。在24个常扩增的致癌基因中,能够在扩增单元观察到的断点数量呈指数减少。这说明,大部分的环状DNA是由随机过程产生的 (图2c)。

作者还比较了不同类型环状扩增子与不同类型基因组不稳定性的关系。环状和非环状DNA显示出相似的可能性来自于染色体水平的非整倍性和全基因组的倍增。作者观察到,在全基因组水平上,被标记为环状扩增子的DNA片段要多于其他类型(图2d)。

图2,环状扩增致癌基因的特征


进一步的,作者研究了环状扩增子在转录水平上的影响。与预期相同,作者观察到DNA拷贝数与致癌基因表达水平的显著相关性。然而,在对DNA拷贝数进行标准化之后,环状扩增子的致癌基因表达水平远远高于非环状扩增子的致癌基因。

大多数的环状扩增子断点表现出极少的同源性(小于5 bp),这说明大多数环状扩增子是由NHEJ的机理进行修复的。与之不同的是,非环状扩增子通常有明显的微同源序列(图3a)。为了研究表观遗传学在环状和非环状扩增子中对基因表达的影响,作者们研究了36个现有的ATAC-seq数据。相比于线性DNA,环状和BFB扩增子有着更加开放的染色质形态(图3b),此前的研究也得出相似的结论,染色质的易接近性在环状DNA致癌基因的表达中发挥重要作用。最后,相较于线性扩增子,环状扩增子有多于5倍的由扩增子产生的转录本融合(图3c)。根据这些结果,作者在环状扩增子结构中观察到的拷贝数,RNA表达和染色质的开放程度的特性是一致的(图3d)。

图3,环状扩增子在转录水平上的影响


为了确定带有环状扩增子的癌症是否与某些生物特性相关,作者研究了环状扩增子在淋巴结中的影响。基因扩增与诊断初期淋巴结的扩散呈相关性。为进一步研究环状DNA与生物特征的相关性,作者研究了在肿瘤细胞中高表达且在免疫浸润中低表达的基因。重要的是,携带ecDNA的患者相比于不携带ecDNA的患者,存活期短5年(图4a)。这说明ecDNA与肿瘤浸润范围有相关性。环状DNA在强侵袭性癌症如胶质母细胞瘤中更为普遍。为了确定存活率和疾病种类的关系,作者构建了COX比例风险模型来检测控制疾病亚种后的存活率。模型显示带有环状DNA的患者的风险比明显增高(图4b)。这些结果都表明,染色体外DNA的扩增与肿瘤的侵略性有着重要相关性。

图4,ecDNA对预后的影响


其他相关方法可参见原文

https://www.nature.com/articles/s41588-020-0678-2

参考文献:

Kim, H., Nguyen, N. P., Turner, K., Wu, S., Gujar, A. D., Luebeck, J., ... & Amin, S. B. (2020). Extrachromosomal DNA is associated with oncogene amplification and poor outcome across multiple cancers. Nature Genetics, 52(9), 891-897.

Deshpande, V. et al. Exploring the landscape of focal amplifications in cancer using AmpliconArchitect. Nat. Commun. 10, 392 (2019).

更多生信分析内容 生信人

意向分析 http://gaptechsxr.mikecrm.com/1vdMmqy

你可能感兴趣的:(生信分析 Nature|染色体外环状DNA与癌症的相关性分析)