Nanopore测序技术必知必会

最近得知王通老师Nanopore测序技术的培训课在B站免费了,那一定是要跟进一波了。王老师在2019年下半年在公众号以四十八个专题分享了Nanopore测序原理、应用以及数据分析教程。其实再写笔记已经没有什么必要了,因为要说的话:直接去看王通老师的公众号以及B站就好了。但是,老师懂得再多,学生还是要学习的哦。

周末把王老师的四十八个专题打印出来,好好学习一把,也简单谈谈Nanopore测序技术吧。每当提到新的技术,我会不由得想起马克思的一句话:任何真正的哲学都是自己时代的精神上的精华。一个优秀的产品也是这样,应该是这个时代技术的精华,代表了一个时代的先进生产力。Nanopore技术的出现告诉我们,我们已近到了一个这样的生命科学时代:使任何人、在任何地点、能对任何生物进行分析。

2003年,人类基因组计划基本完成。该计划的实现不仅在人类探索生物史上谱写了史诗般的篇章,同时也为基因检测在人类遗传病中的运用奠定了重要的基础。某种意义上说,人类基因组计划的实现并不意味着结束而是开始。

什么是Nanopore测序技术

关于Nanopore测序技术最令人印象深刻的一幅图是这样的:

它基本勾勒了Nanopore测序技术的过程:单链DNA分子的ATCG碱基就像阅兵时候的兵哥哥一样路过天安门广场,通过纳米孔的时候释放不同电信号被捕获而后被识别解码为碱基顺序。我们不禁在想:

  • DNA分子的头如何找到这个孔的呢?
  • 是谁牵引着DNA单链往下走的呢?
  • 去哪找这样合适的材料呢?

带着一系列疑问我们看看Nanopore测序技术的简史:

Oxford Nanopore Technologies 有限公司是一家私营企业,总部位于英国牛津市外的牛津科学园,在英国剑桥、美国纽约和波士顿设有办事处,并在日本和法国驻有工作人员。

公司成立于 2005 年,致力于开发基于纳米孔科学的突破性、单分子、电子传感系统。公司的首例产品 MinION 于 2014 年推出,进入客户早期试用阶段,并于 2015 年开始销售。之后,更高通量的 GridION 和 PromethION于 2017 年面世。公司拥有丰富的研发产品线,其中包括可与手机兼容的 SmidgION测序仪。

据说nanopore灵感来自1989年:

这是我见过的最简单的nanopore原理图

nanopore是不是一个好的测序技术呢?要回答这个问题也许我们要回答的是:到底什么才是好的技术?

  • 准确
  • 简单
  • 通量高
  • 便宜

这五个往往不能同时满足,但是有的技术线会逼近它们。Nanopore测序工艺其实也是分为:建库和测序。建库是对序列修饰一番以便于测序,测序就是一个碱基判读的过程。我们还记得沃森和克里克是如何判读的吗?让我们来回顾一下经典的历史场景吧:

显然我们不可能拿个尺子指着一个碱基说:这是T,这是U。
于是:


王老师B站课件

来到Nanopore其实是完成了从化学信号到光学信号到电信号的转变。

为什么要用Nanopore测序技术
  • 超长读长
  • 直接测序
  • 实时测序
  • 按需测序
  • 启动费用低
  • 灵活可扩展

其实最诱人的是它的愿景:倒数第二代测序技术。如其官宣的:

我们的目标:使任何人、在任何地点、能对任何生物进行分析

Oxford Nanopore Technologies 致力于突破现有生物分析方式。我们的技术和商业模式已经让之前未曾直接接触过测序技术的研究人员能够自由地在自己的实验室中或实地进行实时DNA测序和分析。我们一直坚持不断改进技术性能,提高技术易用性,并积极开发更便于用户使用纳米孔测序技术的新领域。这一技术平台旨在使任何人、在任何地点、能对任何生物进行分析。

Oxford Nanopore 成功研发了世界上首例且唯一的纳米孔 DNA 测序仪——MinION。MinION 是一款便携式、实时、长读长、低成本的设备,旨在让任何人,不论是在科学研究、教育、还是在一系列实际应用中,例如疾病/病原体监测、环境监测、食物链监测、自我量化、甚至微重力生物学等领域,都能进行简便的生物分析。自 2015 年开始销售以来,MinION 已被分布在70 余个国家的科学家们广泛使用,助力于他们的科研工作,实现了在传统实验室内和实地环境下的众多应用。

纳米孔传感测序技术具备完全的可扩展性。GridION X5 是一款配有计算模块的台式测序仪,具有可运行多达五个 MinION 测序芯片的能力。此外,另一款具有高通量、高采样数特点的 PromethION 测序仪。

这里我看完都热血沸腾了。之前我们想象到的测序是这样的:洁净敞亮的大型实验室,鳞次栉比的测序仪,不断地吐露着序列。而Nanopore测序的应用场景是这样的:

王老师B站课件

可以说极大地丰富了我们的想象力啊。这感觉就像当年用第一代电子计算机的人看到智能手机一样。


也许在某种程度上二代测序已经很成熟了,能完成测序的绝大多数的应用,但是它还是太过于“工业”了。

Nanopore测序技术怎么用

答案是想怎么用就这么用,现阶段可能要加一个限制,就是有点贵。

首先是Nanopore可以用于DNA以及RNA的测序,也就是我们的基因组和转录组均可以用Nanopore来进一步完善和补齐相关的结构信息。比如2019年的病毒序列:

其实要说一种测序技术的应用不外乎:实验设计,样本捕获,建库测序,数据分析。但是各种技术又有应用的偏重,Nanopore的典型应用:

  • 大基因组组装
  • 细菌完成图
  • 全长无偏倚转录组
  • 大片段结构变异
  • 突变定相分析
  • 微生物快速鉴定

针对不同的应用场景,Nanopore推出了不同的仪器:

每种仪器都配有应用场景以及配套的设施,但是我们并没有必要了解每一个仪器的参数,直到我们真的要用它的时候。

说了这么多,拿到Nanopore数据之后到底该怎么办?

首先Nanopore的数据格式是fast5格式,处理这种格式可以用:


也许你会问fast5格式是什么样的,就是一种存存储各种信息的分层压缩文件。

大多数生物信息分析的数据都是从fastq格式开始,那么我们要做的也就是basecalling。basecalling出fastq文件后面的流程我们也就熟悉了,质控,比对,处理bam文件。只是由于Nanopore的长读长的特点,一些基二代测序的软件看能不能适用了。对我们一般用户来说不过是换个软件配参数与文件就可以了。这里强烈加以大家学习一下conda,用这个安装软件不要太爽。

这里直接把王老师为我们准备的软件列表搬过来吧:

软件名 功能 官方网址
bioconda 生物软件商店 http://bioconda.github.io/
sratoolkit SRA数据管理 https://www.ncbi.nlm.nih.gov/sra/docs/toolkitsoft
flappie 碱基识别 https://github.com/nanoporetech/flappie
albacore 碱基识别 https://github.com/Albacore/albacore
guppy 碱基识别 nanopore社区
MINKNOW 测序操控软件 nanopore社区
hdfview 查看fast5 https://www.hdfgroup.org/downloads/hdfview/
ont_fast5_api 拆分合并fast5 https://github.com/nanoporetech/ont_fast5_api
pomoxis 综合分析 https://github.com/nanoporetech/pomoxis
minion_qc 质控绘图 https://github.com/roblanf/minion_qc
Filtlong 过滤 https://github.com/rrwick/Filtlong
seqkit 序列处理工具包 https://bioinf.shenwei.me/seqkit/
nanopack 数据质控顾虑包 https://github.com/wdecoster/nanopack
NanoPlot 质控绘图 https://github.com/wdecoster/NanoPlot
Porechop 过滤 https://github.com/rrwick/Porechop
MaSuRCA 拼接 https://github.com/alekseyzimin/masurca
Tulip 拼接 https://github.com/Generade-nl/TULIP
spades 拼接 https://github.com/ablab/spades
canu 拼接 https://github.com/marbl/canu
NextDenovo 拼接 https://github.com/Nextomics/NextDenovo
RaGOO 参考引导 https://github.com/malonge/RaGOO
Unicycler 拼接 https://github.com/rrwick/Unicycler
MECAT 拼接 https://github.com/xiaochuanle/MECAT
NECAT 拼接 https://github.com/xiaochuanle/NECAT
miniasm 拼接 https://github.com/lh3/miniasm
WTDBG2 拼接 https://github.com/ruanjue/wtdbg2
SMARTdenovo 拼接 https://github.com/ruanjue/smartdenovo
RA 拼接 https://github.com/rvaser/ra
gfatools gfa文件处理 https://github.com/lh3/gfatools
medaka 纠错 https://github.com/nanoporetech/medaka
pilon 纠错 https://github.com/broadinstitute/pilon/wiki
racon 纠错 https://github.com/lbcb-sci/racon
NextPolish 纠错 https://github.com/Nextomics/NextPolish
quast 拼接评估 http://bioinf.spbau.ru/quast
busco 拼接评估 https://gitlab.com/ezlab/busco
bwa 短序列比对 https://github.com/lh3/bwa
samtools sam格式处理 https://github.com/lh3/samtools
minimap2 比对 https://github.com/lh3/minimap2
NGMLR 比对 https://github.com/philres/ngmlr
last 比对 http://last.cbrc.jp/
GraphMap 比对 https://github.com/isovic/graphmap
MarginAlign 比对 https://github.com/benedictpaten/marginAlign
MUMMER 全局比对 http://mummer.sourceforge.net/
megan 物种鉴定 http://ab.inf.uni-tuebingen.de/software/megan6/download/
diamond blast比对 https://github.com/bbuchfink/diamond
seqtk 序列处理工具 https://github.com/lh3/seqtk
taxonkit 物种分类鉴定 https://bioinf.shenwei.me/taxonkit/
Centrifuge 物种分类 https://github.com/DaehwanKimLab/centrifuge
Nanopolish 综合分析 https://github.com/nanoporetech/nanopolish
NanoSV 变异检测 https://github.com/mroosmalen/nanosv
Sniffles 变异检测 https://github.com/fritzsedlazeck/Sniffles
NanoVar 变异检测 https://github.com/benoukraflab/NanoVar
tombo 甲基化 https://github.com/nanoporetech/tombo
bcftools vcf格式处理 https://github.com/samtools/bcftools
Truvari 变异检测 https://github.com/spiralgenetics/truvari/
Pinfish 异构体鉴别 https://github.com/nanoporetech/pinfish
pychopper 异构体鉴别 https://github.com/nanoporetech/pychopper
tablet 可视化 https://ics.hutton.ac.uk/tablet/
IGV 可视化 http://software.broadinstitute.org/software/igv/

每一个软件都可以写一篇新的文章了,所以不在本文的讨论之列。

软件有了,然后就可以生产数据进行分析,当然在学习的前阶段,我们可以下载一些数据进行学习。



Nanopore测序技术||B站
三代测序之nanopore测序

你可能感兴趣的:(Nanopore测序技术必知必会)