关键词/Nanopore测序技术 文/基因慧
随着基因测序技术不断突破,二代测序的发展也将基因检测成本大幅降低。理想的测序方法,是对原始DNA模板进行直接、准确的测序,消除PCR扩增带来的偏差,保留重要的碱基修饰信息,并且测序序列长度(读长)不受限制,从而能够检测大型的结构变异和解析含有高度重复DNA片段的区域。纳米孔测序技术的出现,不仅提供快速实时答案,同时还具备高数据产出。同时,其便携式和规模上的可扩展性给未来测序技术应用带来无限想象空间。Oxford Nanopore在近年快速进入中国的历程可见一斑。
1
测序技术的迭代突破
当我们回顾测序技术发展时,首先谈到的必然是人类基因组计划(HGP),得益于测序技术的重大发现(Frederick Sanger于1977年发表了双脱氧核苷酸末段终止法,也称第一代Sanger测序,成为当时DNA测序的首选技术)以及当时多款测序仪的成功商业化,HGP可以顺利且提前完成,这对后面整个基因组学的发展产生了深远影响。值得一提的是作为该计划主力军的ABI 3700的改进型ABI 3730,至今仍被用来验证新一代测序仪发现的SNP等结果而被称作“黄金标准”。
图1,弗朗西斯·柯林斯博士宣布人类基因组序列图绘制成功
而当HGP正式宣布完成之时,富有远见的HGP领导人便提出了“HGP的完成意味着基因组时代真正的开始”,美国NIH也随之制定了5年内和10年内将个人全基因组测序成本分别降低到十万美元和一千美元的“两步走”战略目标,在这样的一个时代背景下,以罗氏的454、Life Technologies的Solid测序平台、Illumina的Solexa为开端的第二代高通量测序技术开始登上舞台,其中illumina的测序仪业务在三家之中后来居上,经过自身技术积累以及商业并购的方式,成为目前基因组技术领域最为重要的提供者。从技术层面看,第二代高通量测序以边合成边测序为原理,通过对PCR分子簇上碱基连接的荧光信号进行捕获,并转换为碱基信息。与Sanger测序相比,具有通量高,单碱基成本低的巨大优势,并立刻被研究者所广泛应用,当然这也是建立在牺牲“读长”的基础之上。短读长由于序列短,无法轻易的匹配到人类参考基因组。一些文章指出,目前尚有8%的人类基因组未被测序。因此,如何兼顾高通量和读长的优势,来满足更多科研和医学的基因组项目研究的需求,成为了新一代测序仪的市场入口。
如开头所说,理想的测序方法应该是对原始DNA模板进行直接、准确的测序,并且不受读长限制。早在20世纪80年代,研究人员就开始为了实现这个目标而努力,随着纳米、芯片、精密加工、光学电子、酶工程等技术的有效发展,以不经扩增的单分子、长读长的新一代测序逐渐走进大众视线。
新一代测序技术的代表企业,英国Oxford Nanopore Technologies Ltd(以下简称Oxford Nanopore)在2005年正式成立,并于2015年正式面向市场出售掌上测序仪MinION。其随后推出了可以用于大型基因组和大规模人群测序的台式GridION以及高通量测序仪PromethION。
图2,Oxford Nanopore测序平台
Oxford Nanopore的核心技术——纳米孔(nanopore)测序技术也被公认为未来测序发展的一大方向。与以往的测序技术皆有不同,它不是通过检测光、荧光信号颜色、或PH来实现碱基序列的读取,而是基于电信号的测序技术。蛋白质纳米孔(微型的小孔,其本质是在膜上形成通道)被嵌入在合成膜上,并浸没在电生理溶液中,使离子电流通过纳米孔。在像DNA或RNA这样的分子通过纳米孔时,会对电流带来干扰,引起电流信号的特征性改变。在此过程中,信号被实时分析,用来确定正在通过该孔的DNA或RNA链的碱基序列。纳米孔会分析通过它的整个DNA或RNA片段。因此,在纳米孔测序中,读长长度与制备样本中DNA或RNA的长度一致。用户可以根据他们想要的实验结果来选择恰当的样品制备方法,生成最适合的读长长度(目前,使用标准的DNA提取方法已能够获得数万到数十万碱基的读长,而由纳米孔社区用户设计的温和提取法已获得了超过2Mb的读长)。
Oxford Nanopore近期发布了用于便携式MinION和台式GridION的测序芯片更新——Rev D版本。新版测序芯片延长了能被用于DNA或RNA测序的时间,将总DNA数据产量提升至高达30Gb每张芯片,内部测试能够得到50Gb。高通量测序仪PromethION使用不同的测序芯片,内部测序单张芯片数据产出已达220Gb。用户实际测序反馈最高数据产出目前为150Gb。
2
纳米孔测序的特点
1)长读长
长读长提供了一个更明确的方法来比对和匹配DNA或RNA序列,提供高质量、更完整、更连续的基因组组装。在类如植物基因组和具有大型结构变异和高水平重复区域的基因组中优势显著。就像拼图一样,读长越长,组装越容易。对于DNA,长读长的优势在于能够简化从头组装,改进参考基因组,进行phasing,以及快速的宏基因组物种鉴定。对于RNA,它能够用于表征全长转录本,以及对异构体、剪接变体和融合转录本进行量化和分析。
2)直接测序
由于纳米孔技术支持对原始DNA和RNA链直接进行测序,不需要通过DNA拷贝、进行链合成或使用亚硝酸盐进行转化,这不仅节省了时间和成本,还意味着碱基修饰的信息(例如5mC,pseudouridine,m6A)会被完整的保留,并且包含在测序运行产生的原始信号信息中,随时进行分析。由于纳米孔技术支持无需PCR的直接测序,也就没有了扩增偏好性,并且文库制备工作流程也更简单。
3)实时
与在运行结束时批量交付数据的传统测序技术不同,纳米孔技术提供的是动态、实时的测序,支持在几分钟内就获得病原体鉴定等时间关键型应用的检测结果。用户可以在测序早期了解样本的质量和状态,也可以在获得足够的数据后停止测序。快速的采样到结果周转时间在未来感染性疾病、实地动态监测疫情爆发以及其它诊断方面具有巨大潜力。
4)按需要测序
与传统测序技术不同的是,在纳米孔测序中,用户可以自行掌握测序时间、地点、以及需要使用的芯片数量。例如,可以单次使用的最小型的测序芯片Flongle适合快速质量检测、小型基因组实验和靶向测序。便携式测序仪MinION,重量不足100g,可以被带到任何地方测序任何样本。台式测序仪GridION和PromethION分别具有5个和48个测序芯片,每个芯片可以独立运行,也可以同时使用,并结合实时的数据传送。这意味着用户可以根据样本的数量选择芯片数量,随数据量要求随时启动和停止实验。
5)灵活、可扩展
所有Oxford Nanopore测序设备使用同样的核心技术,用户可以轻松根据应用测试实验以及扩大或缩小规模。从最小型的Flongle和掌上MinION,到桌面型的GridION和PromethION。所有设备都可用于进行按需测序实验。包括从单次试验到超高通量项目,全部都可提供快速、长读长、实时的DNA或RNA直接测序。用于纳米孔测序的DNA或RNA建库过程简单直接,最快的建库方法只需5到10分钟就可在样本分子末端添加测序接头及马达蛋白。用户可选择制备1D或1D2文库。在1D测序中,模板链和互补链将作为独立分子进行测序。而在1D2测序中,添加了一种不同的接头,使得互补链可以紧跟模板链通过纳米孔,对两条链进行测序,达到更高的准确度。
所有的设备均在实验一启动就开始传输数据,将信号变化转换为碱基序列。这都可以在用户的计算机或Oxford Nanopore的机载设备上在本地进行,实时分析意味着可即时获得信息,了解正在进行的测序以及实验质量,而无须等待整个运行结束。用户还可利用EPI2ME设备控制软件所含的工作流程进行实时分析,从快速物种识别到人类基因组序列比对,也可以使用自己开发或来自纳米孔社区的工作流程。
3
从小型实验室到外太空,到高通量测序设备
Oxford Nanopore近年来重要时间线:
图3,MinION已经在国际空间站上执行了纳米孔DNA和直接RNA测序。图片来源:Oxford Nanopore 技术原理手册
2017年底,Oxford Nanopore的MinION测序仪正式面向中国的消费者发售。在最初进入中国市场时,Oxford Nanopore在上海办公室派驻技术支持专员为中国使用者提供技术服务,并随后在中国成立了分公司(奈米普科技(上海)有限公司)。相比较于那些动辄上百万至上千万美元一套的大型测序仪而言,Oxford Nanopore平台的消费级测序仪的价格真可谓美好,不管是寻常实验室还是小型测序服务商都能配置的起,行业内开玩笑说愿意拿iPhone去换一台MinION,可见价格之亲民。
随着相关化学试剂的升级和算法的不断突破与改进,以及后续PromethION的发布,nanopore测序技术的通量和准确率都有大幅提升。在刚刚过去的11月底举行的用户大会上,其首席技术官Clive Brown介绍了新纳米孔设计——R10,预期在2019年初发布。相较于当前的纳米孔版本(R9),R10版纳米孔的“桶身”更长,具有两对Reader heads,意味着更多的碱基信号来确保更高的准确度,尤其是在均聚物(由一种单体聚合成的)区域。在测序中,质量值Q是衡量测序质量的重要指标,Q值越高,代表碱基被测错的概率(P)越小。在公司内部测试中,以75倍的基因组测序覆盖度,新的R10纳米孔数据质量值超过Q40(即错误识别的概率是0.01%,即错误率0.01%),一致性(Identity)质量值达Q50 (99.999%的碱基准确率)。
Oxford Nanopore Technologies公司CEO Dr. Gordon Sanghera
“我们的目标是让任何人都能在任何环境下分析任何生物。我们的技术已经得到了广泛的应用,除了用于寻找病原体种类监控病源——比如追踪埃博拉病毒等,也被应用于农业和教育方面,主要针对遗传学和生命健康方面。大家都很熟悉物联网(Internet of Things)的概念,它说的是所有的事物都能被互联网联系在一起,并能够通过你的智能手机控制。所有生物都有DNA,我们可能会好奇它们是什么类型的DNA,是否在发生变化、是否健康等等。你可以设想“生物物联网”(Internet of Living Things)这样的一个概念,即我们可以对DNA进行实时测序,并得到即时的结果反馈。我们是全球唯一一家能够做到提供动态实时结果、进行有成本效益、按用户需要扩大或缩小规模测序的公司。例如,现在就有一种病毒正在攻击在非洲和其它一些国家都很受欢迎的木薯作物。科学家们就在实地利用MinION鉴定病毒种类,研究提高作物产量的战略性措施。如果拥有实时的DNA信息,就可以实现“生物物联网”(Internet of Living Things)。因此,我们公司的目标就是让任何人、在任何地方都可以获取DNA信息。”
4
纳米孔测序的应用领域
图4,纳米孔测序的应用领域,图片来源:Oxford Nanopore 技术原理手册
在应用方面,Nanopore测序目前尚仅供研究使用。除了目前科研市场火热的基因组应用,如取证工作、水质检测、生物防御、疫情爆发调查和监控、食品安全等,使用nanopore测序的科学家们还在不断拓宽医学和生物学应用领域,如在肿瘤或遗传病DNA的分析中高分辨率的结构变异分析;在生殖医疗研究中,有潜力应用于胚胎植入前遗传学筛查(PGS)或胚胎植入前基因诊断(PGD),检测染色体数目畸变及增加的潜在风险。还可应用于植物基因组以及大规模人群基因组测序项目。
正如很多学者所说,“新一代测序技术的出现照亮了过去从未看到的基因组的黑暗角落”。
参考资料:
1. 《基因组学》(杨焕明编著)
2. 《高通量测序技术》(李金明主编)
3. Oxford Nanopore Technologies 官方网站,访问时间2018年12月27日。https://nanoporetech.com/
编者:Clare 校对:Eric 审核:Mark
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外3000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”