Nanopore测序笔记

原理:基于不同建立经过纳米孔时,电流信号的差异
典型应用:

  • 读长比较长,利于拼接
  • 解决动植物多倍体高重复、高杂合的特性
  • 也适用于细菌拼接
  • 对RNA直接测序,无需反转录,直接识别RNA的碱基修饰
  • 适合检测大片段结构变异
  • 测序长度越长对定相分析越有利

测序设备

设备名称 特点
minION 入门选择,手持式,数据量30Gb
GridION 相当于5张芯片外加一台服务器
PromethION 24或48个测序芯片,数据量达到Tb级别
MinION Mk1C 可连接蓝牙或者Sim卡
Flongle MinION和GridION的转换器
MinIT 预装Linux系统
VolTRAX 自动化文库制备

建库测序
对待测DNA的一些处理,是一个模板过程。

  • DNA提取
    评估核酸质量和完整性
    可以使用Nanodrop仪器进行检验。
    DNA :A260/A280 = ~1.8 ,A260/A230=~2.0-2.2
    RNA : A260/A280 = ~2.0 ,A260/A230=~2.0-2.2
    评估片段大小
    使用Agilent Bioanalyzer/Tapestation,PFGE,fragment analyzer,FEMTO pulse
    nanopore建库
    Nanopore测序笔记_第1张图片
    建库图

    给待测DNA两侧先加上A碱基,使平末端变成粘性末端,然后再加上Y接头以及马达蛋白。
    测序错误
    碱基识别的非准确性,每秒读数也不恒定。信号读取的频率无法做到一个碱基读一个,而是多个碱基一起读一个信号,相当于一个分类器。

nanopore测序文件可以生成fast5文件和fastq文件
fast5文件: 大而全,耗存储大,适合做碱基校正和表观遗传学分析。记录着设备运行时全部的信息,包括捕获的电信号值,设备运行时间,电压,温度等等信息。

  • 可以使用HDFView 查看Fast5文件格式。https://www.hdfgroup.org/downloads/hdfview/
  • 可以使用ont_fast5_api软件对fast5文件进行拆分与合并

fastq文件:常用,厂商一般给的,包含碱基和碱基质量
流程
Basecalling:将原始测序文件转换为碱基序列的过程
,如guppy工具主要包括三大功能:
1、碱基识别
这是它的主要功能,Guppy使用神经网络算法(RNN)将电信号数据解读为DNA或RNA的五个标准碱基,即腺嘌呤,鸟嘌呤,胞咳淀,胸腺咳淀和尿密淀。
2、拆分条码数据
如果建库时添加了barcode条形码,那么在序列开端和尾端均有Oxford Nanopore Technologies提供的条形码序列,Guppy数据拆分功能基于识别出的碱基序列。这个原理类似于illumina basecalling中的index拆分。
3、比对
将测序数据与参考序列进行比对,其实这个是调用minimap2做的,而且选项参数都是内置的,无法调整,所以,这个功能还是不要使用了,一个软件还是把自己该做的事情做好。
4、甲基化修饰位点检测
如果某个碱基发生了甲基化修饰,那么在碱基识别过程中就会表现出一些异常信息,这些离群信息有可能就是潜在的甲基化修饰位点,guppy目前也可以进行碱基修饰的检测,不过这个需要学习集,不同物种需要单独的学习集,目前只试验了大肠杆菌,人等模式生物,如果有需要可以尝试进行检测。
下载和安装参考官网

使用minion_qc来进行统计绘图

常用软件

软件名 功能 官方网址
bioconda 生物软件商店 http://bioconda.github.io/
sratoolkit SRA数据管理 https://www.ncbi.nlm.nih.gov/sra/docs/toolkitsoft
flappie 碱基识别 https://github.com/nanoporetech/flappie
albacore 碱基识别 https://github.com/Albacore/albacore
guppy 碱基识别 nanopore社区
MINKNOW 测序操控软件 nanopore社区
hdfview 查看fast5 https://www.hdfgroup.org/downloads/hdfview/
ont_fast5_api 拆分合并fast5 https://github.com/nanoporetech/ont_fast5_api
pomoxis 综合分析 https://github.com/nanoporetech/pomoxis
minion_qc 质控绘图 https://github.com/roblanf/minion_qc
Filtlong 过滤 https://github.com/rrwick/Filtlong
seqkit 序列处理工具包 https://bioinf.shenwei.me/seqkit/
nanopack 数据质控顾虑包 https://github.com/wdecoster/nanopack
NanoPlot 质控绘图 https://github.com/wdecoster/NanoPlot
Porechop 过滤 https://github.com/rrwick/Porechop
MaSuRCA 拼接 https://github.com/alekseyzimin/masurca
Tulip 拼接 https://github.com/Generade-nl/TULIP
spades 拼接 https://github.com/ablab/spades
canu 拼接 https://github.com/marbl/canu
NextDenovo 拼接 https://github.com/Nextomics/NextDenovo
RaGOO 参考引导 https://github.com/malonge/RaGOO
Unicycler 拼接 https://github.com/rrwick/Unicycler
MECAT 拼接 https://github.com/xiaochuanle/MECAT
NECAT 拼接 https://github.com/xiaochuanle/NECAT
miniasm 拼接 https://github.com/lh3/miniasm
WTDBG2 拼接 https://github.com/ruanjue/wtdbg2
SMARTdenovo 拼接 https://github.com/ruanjue/smartdenovo
RA 拼接 https://github.com/rvaser/ra
gfatools gfa文件处理 https://github.com/lh3/gfatools
medaka 纠错 https://github.com/nanoporetech/medaka
pilon 纠错 https://github.com/broadinstitute/pilon/wiki
racon 纠错 https://github.com/lbcb-sci/racon
NextPolish 纠错 https://github.com/Nextomics/NextPolish
quast 拼接评估 http://bioinf.spbau.ru/quast
busco 拼接评估 https://gitlab.com/ezlab/busco
bwa 短序列比对 https://github.com/lh3/bwa
samtools sam格式处理 https://github.com/lh3/samtools
minimap2 比对 https://github.com/lh3/minimap2
NGMLR 比对 https://github.com/philres/ngmlr
last 比对 http://last.cbrc.jp/
GraphMap 比对 https://github.com/isovic/graphmap
MarginAlign 比对 https://github.com/benedictpaten/marginAlign
MUMMER 全局比对 http://mummer.sourceforge.net/
megan 物种鉴定 http://ab.inf.uni-tuebingen.de/software/megan6/download/
diamond blast比对 https://github.com/bbuchfink/diamond
seqtk 序列处理工具 https://github.com/lh3/seqtk
taxonkit 物种分类鉴定 https://bioinf.shenwei.me/taxonkit/
Centrifuge 物种分类 https://github.com/DaehwanKimLab/centrifuge
Nanopolish 综合分析 https://github.com/nanoporetech/nanopolish
NanoSV 变异检测 https://github.com/mroosmalen/nanosv
Sniffles 变异检测 https://github.com/fritzsedlazeck/Sniffles
NanoVar 变异检测 https://github.com/benoukraflab/NanoVar
tombo 甲基化 https://github.com/nanoporetech/tombo
bcftools vcf格式处理 https://github.com/samtools/bcftools
Truvari 变异检测 https://github.com/spiralgenetics/truvari/
Pinfish 异构体鉴别 https://github.com/nanoporetech/pinfish
pychopper 异构体鉴别 https://github.com/nanoporetech/pychopper
tablet 可视化 https://ics.hutton.ac.uk/tablet/
IGV 可视化 http://software.broadinstitute.org/software/igv/

以上内容整理至知乎https://zhuanlan.zhihu.com/p/102392867
原作者 公众号 基因学苑

你可能感兴趣的:(Nanopore测序笔记)