linux下blast(2.7.1+)的使用

       Blast 的运行方式是先用目标序列建数据库(这种数据库称为database,里面的每一条序列称为subject),然后用待查的序列(称为query)在database 中搜索,每一条query 与database 中的每一条subject 都要进行双序列比对,从而得出全部比对结果。
blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。
blastx:核酸序列与蛋白库的比对,先将核酸序列翻译成蛋白序列(根据相位可以翻译为6种可能的蛋白序列),然后再与蛋白库做比对。
blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。
tblastn:蛋白序列对核酸库的比对,将库中的核酸翻译成蛋白序列,然后进行比对。
tblastx: 酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后
对蛋白序列进行比对
       blast 的运行分为两个步骤:第一,建立目标序列的数据库;第二,做blast 比对。
1.运行建库程序formatdb(核酸数据库为nucl,蛋白质数据库为prot):

makeblastdb -in E8_G9_L008_R2.fa -dbtype nucl -title E8_G9_L008_R2 -parse_seqids -out E8_G9_L008_R2_db

       如果建立的是核酸库,输出为db.seq.nhr、db.seq.nin、db.seq.nsp、db.seq.nog、db.seq.nsd、db.seq.nsi。
2、运行比对程序

blastn -query complement_E8_G9_L007_R1.fa -db E8_G9_L007_R2_db -out E8_G9_L007.out -outfmt 7 -evalue 1e-10 -task blastn

你可能感兴趣的:(linux下blast(2.7.1+)的使用)