20201123-基因组比对分类及相关软件

纸上得来终觉浅,绝知此事要躬行。
——陆游《冬夜读书示子聿》

什么是比对?

比对的英文是alignment,其对应的中文翻译可以是比对,联配,对齐,排列等,目前并没有一个统一的用词。中文文章中多见比对,联配。

序列比对就是运用特定的算法找出两个或多个序列之间产生最大相似度得分的空格插入和序列排列方案。

全基因组比对,顾名思义,就是在全基因组水平进行的序列比对。

基因组比对分类及相关软件

基因组水平上序列比对可以分为同一物种基因组重测序数据的比对不同物种间基因组的比对,当然也可以把一个物种的重测序数据比对到另外一个物种的参考基因组上,算是第一类的延伸。

这两类由于数据性质不同,采用的比对软件也不一样。

一般来说,重测序数据比对多采用BWABowtie2;
不同物种间基因组(不同物种的参考基因组)的比对常用共线性比对,如LastZ,此外还有Last。

相关代码

BWA

#bwa-index构建索引
bwa index genome.fa -p genome   
#双端测序比对(设置线程数为8) 
bwa mem -t 8 genome Seq1.fq Seq2.fq > output.sam

Bowtie2

#Bowtie2-build构建索引(设置线程数为8) 
bowtie2-build --threads 8 genome.fa genome   
#双端测序比对(设置线程数为8) 
bowtie2 -p 8 -x genome -1 Seq1.fq -2 Seq2.fq -S output.sam

LastZ

#不同物种参考基因组比对,输出结果格式为maf 
lastz genome1.fa[multiple] genome2.fa[multiple] --notransition --step=20 --nogapped --format=maf > output.maf 
#不同物种参考基因组比对,输出结果格式为axt 
lastz genome1.fa[multiple] genome2.fa[multiple] --notransition --step=20 --nogapped --format=axt+ > output.axt

Last

Last软件还未进行实践,相关代码实现参考Example 9: Compare the human and chimp genomes

你可能感兴趣的:(20201123-基因组比对分类及相关软件)