Racon三代数据纠错2021-01-19

使用minimap2将三代数据比对到基因组,再使用racon纠错。做3次。

一、软件安装

minimap2安装:直接github上下载make安装。
https://github.com/lh3/minimap2

racon使用conda install -c bioconda racon racon 安装。
也可以直接安装。

二、将fasta比对到基因组

先建立索引,在比对。
x :非常中要的一个选项,软件预测的一些值,针对不同的数据选择不同的值
map-pb/map-ont: pb或者ont数据与参考序列比对;
ava-pb/ava-ont: 寻找pd数据或者ont数据之间的overlap关系;
asm5/asm10/asm20: 拼接结果与参考序列进行比对,适合~0.1/1/5% 序列分歧度;
splice: 长reads的切割比对
sr: 短reads比对
-d :创建索引文件名
-a :指定输出格式为sa格式,默认为PAF
-Q :sam文件中不输出碱基质量
-R :reads Group信息,与bwa比对中的-R一致
-t:线程数,默认为3

minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa       # indexing
minimap2 -ax map-pb   -t 8  ref1.mmi ../data/pb.fasta.gz > map1.sam      # aligment

三、使用racon纠错

racon -t 8 ../data/pb.fasta.gz map1.sam prefix.ctg.fa > prefix1.fa

polish做三次

#fist polish
minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa
minimap2 -ax map-pb -t 8  ref1.mmi ../data/pb.fasta.gz > map1.sam
racon -t 8 ../data/pb.fasta.gz map1.sam ../assemble/prefix.ctg.fa > prefix1.fa
# second polish
minimap2 -d ref2.mmi prefix1.fa
minimap2 -ax map-pb -t 8  ref2.mmi ../data/pb.fasta.gz > map2.sam
racon -t 8 ../data/pb.fasta.gz map2.sam  prefix1.fa  > prefix2.fa
# third polish
minimap2 -d ref3.mmi prefix2.fa
minimap2 -ax map-pb -t 8  ref3.mmi ../data/pb.fasta.gz > map3.sam
racon -t 8 ../data/pb.fasta.gz map3.sam  prefix2.fa  > prefix3.fa

参考
https://github.com/lh3/minimap2
https://zhuanlan.zhihu.com/p/92701077?from_voters_page=true
https://blog.csdn.net/u012110870/article/details/82500726

你可能感兴趣的:(Racon三代数据纠错2021-01-19)