盘点结构变异在医学研究中的应用

转自:https://mp.weixin.qq.com/s/EFhFnAc25tCo4-kqdUSt8g

人类遗传学领域的核心是遗传变异研究。迄今为止,绝大多数遗传研究都集中在单核苷酸变异(Single-nucleotide variants, SNVs)上。据统计,每个人类基因组大约有20,000个结构变异(Structural variations,SVs),跨越1,000万个碱基对,是受SNVs影响的碱基数量的两倍多。相比SNVs,SVs在更大程度上推动了人类的进化,导致个体之间出现遗传多样性,此外,已有大量研究表明,SVs在疾病和肿瘤的发生中的重要作用。上期小编给大家盘点了SVs是如何在动植物群体研究中大显身手的(详情请见:结构变异,动植物基因组学研究的下一个风口),本期小编带大家看一下SVs是如何在人类基因组研究中一展神通的。

发现复杂结构变异类型

SVs在人类基因组中广泛存在,是健康和疾病易感性的重要驱动因素。SVs非常复杂,尤其在癌症中,癌症基因组通常包含数百个体细胞DNA重排连接点,其中许多不易分类为简单(例如,缺失和易位)或复杂(例如,染色体碎裂)的SVs类型,获得一个基因组上所有的SVs(包括复杂SVs),有助于生成特异的,针对特定疾病、个人或人群的金标准参考结构变异集。

举个例子

2020年10月Cell发表的癌症基因组图揭示不同类别的复杂结构变异的研究中,美国威尔康奈尔医学院研究者利用连接平衡分析(JaBbA)的算法,根据2778个肿瘤全基因组序列的“连接拷贝数(JCN)”图谱来搜索SVs,发现了三种新颖的复杂重排现象:Pyrgo、Rigma和Tyfonas,Pyrgo是低JCN的“塔形”重复,Rigma是低JCN缺失的“裂谷”,Tyfonas是高JCN连接和折叠倒位的“台风”。利用不同类型的SVs衍生事件图谱定义不同的肿瘤簇,研究表明,本研究中引入的复杂SVs类型(Pyrgo、Rigma和Tyfonas)在很大程度上独立于已知的复杂SVs类型。其中Rigma主要集中于胃肠道肿瘤(如食管癌、结直肠癌和胃腺癌),Tyfonas在肢端黑色素瘤中均较丰富,而乳腺癌和卵巢癌似乎更容易发生Pyrgo突变。生存分析显示,在新的SVs (Pyrgo、Rigma和Tyfonas)类型占主导地位的群体存活率较低。研究表明,基于基因组图衍生的特征将有助于将基因组SVs与临床变量,包括治疗反应联系起来。

图1 三种复杂SVs的示例图及其与肿瘤的关联

揭示人类基因组遗传多样性

以往人们认为SVs是很罕见的基因组事件,实际上,SVs在很多群体中都有相当高的频率,并且其在基因组中是并非随机分布的,SVs的检测和表征改变了人们对不同物种基因组变异格局的理解。在人类研究上,科学家们一直致力于对人类基因组多样性的挖掘与理解,期望更好地理解人类遗传多样性、人类进化历史以及推动基因组医学研究。

举个例子

2019年1月Cell发表的人类基因组结构变异主要等位基因特征的研究中,华盛顿大学医学院研究者瞄准了当前人类基因组注释中的缺陷,通过运用长读长测序技术深度挖掘人类基因组SVs,并对SVs进行分类解析,明确了SVs在人类基因组研究中的重要作用,矫正了人们对SVs认知的误差。结果发现,PacBio长读长测序得到的SVs数据集与数千人的Illumina测序SVs数据集的比较,发现有87.3%是新发现的SVs,与HGSVC数据集的比较,有40.8%是新发现的SVs。将非冗余SVs分为四大类别:共有的、主要的(≥50%但并非所有样本中存在)、多态的(多于一个但<50%样本中存在)以及特异的SVs。和预期一致,非洲样本多态性最丰富,平均每一个非洲人样本贡献了11.1%的特异性SVs,而非非洲人样本平均是5.6%。研究者又将共有的和主要的SVs和RefSeq注释结果交叉分析,解析了86个影响编码序列的事件、47个UTRs(非翻译区)事件、7417个内含子或任何基因2Kb空白区域中的事件。

图2 15个人类基因组中发现的SVs

研究人类群体环境适应性

SVs非常复杂,可以发生在基因组的编码区,也可以发生在非编码区。SVs可能通过改变基因序列或拷贝数,改变顺式调控序列的组成、位置,或通过改变三维基因组结构来影响基因的表达,进而影响生物的表型和进化轨迹。基因组的SVs为群体进化提供了原始材料和适应性基础。

举个例子

2019年10月National Science Review发表的藏族人基因组的从头组装及与高原适应相关的新结构变异的鉴定的研究中,研究者利用三代长读长测序技术以及多种辅助组装技术,从头组装了一个高质量的藏族人参考基因组(珠峰1号,ZF1)。利用PacBio长读长测序数据检测SVs,共获得17,900 SVs,其中75%的SVs得到了其他平台SVs结果的支持, 36.3%的SVs是ZF1有别于其他两个东亚人(HX1和AK1)的SVs。功能富集分析发现ZF1特有的SVs相关基因(共1,832个)显著富集在一个重要的低氧通路——GTPase活性调控通路上。通过进一步的群体分析,研究人员发现了一个发生在 *MKL1 *基因内含子上的163bp缺失,这个缺失在藏族和汉族群体中表现出显著的频率差异,结果表明,该缺失与肺动脉收缩压呈负相关, *MKL1 *缺失携带者往往具有较低的肺动脉压,这与藏族人众所周知的低缺氧性肺血管收缩反应是一致的。另外,研究人员系统评估了藏族人基因组中与古人类共享的基因片段,发现ZF1相比于其他东亚个体的基因组有更高的共享片段比例。其中一个典型的例子是发生在 *SCUBE2 *基因内含子上一个662bp的插入,分析表明该插入在藏族人中富集并与藏族人的肺功能显著相关。

图3 藏族人MKL1基因163bp缺失及其与生理性状的关系

助力疾病诊断研究

研究表明,许多疾病的发生与SVs密切相关。据统计,基因组SVs可能导致的疾病已经超过1,000种,而使用短读长测序技术进行全外显子组和基因组测序,目前的诊断率不到50%,三代长读长测序可获取完整的基因组信息,包括先前二代无法进行测序的区域,对疾病的的诊断及发生机制的探究奠定基础。

举个例子

2020年7月bioRxiv发表的长读长基因组测序在神经发育障碍诊断中的应用研究中,美国哈森阿尔法生物技术研究所研究者利用PacBio HiFi测序对6个患者家庭的先证者以及他们的父母进行研究,这6个患者家庭的先证者以及他们的父母已经进行了基于NGS的全基因组或全外显子组测序,然而并没有找到可解释的线索。利用三代测序,在一个先证者中,发现了一个可能致病的变异, *CDKL5 *基因内复杂的L1介导的插入事件,该插入使外显子3重复,导致移码和功能丧失。在第另一个先证者中,发现了从头易位,导致 *MLLT3 *基因被破坏,使 *MLLT3 *基因表达水平降低,该变异被分类为意义不明(VUS)的变异。研究表明,HiFi测序可以检测到通过NGS无法检测到的复杂的SVs,未来它很可能将成为罕见疾病遗传学中进行临床研究和诊断测试的强大一线工具。

图4 先证者6具有从头插入突变,导致CDKL5的外显子3重复

探究癌症发生机制

SVs(包括倒位、缺失、重复和易位)是大多数癌症基因组的标志。常发性SVs的发现及其对基因结构和表达的影响极大提高了我们对肿瘤发生的认识。很多致癌基因已经被明确是常发性易位的产物,这已为药物治疗提供了成功靶标。检测癌症基因组中的SVs仍然是遗传学家和癌症生物学家面临的挑战,高精度的基因组SVs检测有助于癌症发生、侵袭及转移研究。

举个例子

2018年7月Cell发表的转移性前列腺癌的基因组特征和结构变异的研究中,美国华盛顿大学圣路易斯医学院研究者对101位转移性去势抵抗性前列腺癌(mCRPC)患者的前列腺癌组织进行了全基因组和转录组的测序分析。研究表明,每个患者中基因组变异的比例在7%到47%之间(中位数23%),受SVs影响最频繁的位点包含前列腺癌的关键驱动因素,如研究人员在81%的患者中发现了雄激素受体(AR)上游基因间增强子区域的扩增,该区域是常见的调节基因区域,突变AR对低水平的雄激素异常敏感,从而驱动前列腺癌进展和侵袭。其他受SVs影响的基因还包括包括MYCFOXA1PTEN、*TP53 *等,这些都是重要的肿瘤驱动基因。研究表明,前列腺癌的侵袭性是肿瘤驱动基因的调节基因发生SVs进而促进结构基因表达的结果。

图5 SVs干扰抑癌基因并激活癌基因

三代测序助力结构变异检测

研究表明,结构变异在功能、进化和医学上都非常重要。以往对结构变异的作用研究较少,理解的也不够透彻,随着三代测序技术的崛起,越来越多的研究开始关注结构变异。三代测序具有超长读长、无 PCR 扩增、无 GC 偏好性,可轻松跨越高重复和低复杂区域的优势,在大片段结构变异(≥50bp)的检测中有天然优势。对于结构变异检测,贝瑞基因通过构建****PacBio文库(CLR模式或HiFi模式可灵活选择)和PacBio测序,实现动植物基因组结构变异的全面、准确检测。

技术优势
  • 有效检出大片段SV
    PacBio测序凭借其长读长的优势可轻松跨越高重复和低复杂度区域,增加大片段结构变异检出率。

  • 揭示基因组全面SV
    PacBio测序无GC偏好性,可以跨越有GC偏好的区域,检测范围几乎覆盖整个基因组,可以检测更加全面的基因组SV事件。

  • 检出SV准确率高
    PacBio测序平台运行平稳,准确率高,同时配套官方专业SV检测流程,技术成熟,大大提高SV检出的准确率。

参考文献:

  1. Hadi K, Yao X, Behr JM, Deshpande A, et al. Distinct Classes of Complex Structural Variation Uncovered across Thousands of Cancer Genome Graphs[J]. Cell, 2020.

  2. Audano PA , Sulovari A , Graves-Lindsay TA , et al. Characterizing the Major Structural Variant Alleles of the Human Genome[J]. Cell, 2019.

  3. Ouzhuluobu, Yaoxi H , Haiyi L , et al. De novo Assembly of a Tibetan Genome and Identification of Novel Structural Variants Associated with High-altitude Adaptation[J]. National Science Review, 2020.

  4. Susan M. Hiatt, James M.J. Lawlor, et al. Long-read Genome Sequencing for the Diagnosis of Neurodevelopmental Disorders[J]. bioRxiv, 2020.

  5. Quigley DA, Dang HX, Zhao SG, et al. Genomic Hallmarks and Structural Variation in Metastatic Prostate Cancer[J]. Cell, 2018.

你可能感兴趣的:(盘点结构变异在医学研究中的应用)