SPAdes与Velvet拼接序列 及QUAST评价两者差异

背景:目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的测序,产生大量的测序结果。接下来就要对序列进行拼接,用于拼接的软件也有很多。这里我们将采用SPAdes和Velvet对同一组数据处理并比较。
处理的文件分别为test_7942raw_1.fq.gz和test_7942raw_2.fq.gz

SPAdes组装

1、由于我的fq文件在Seqs目录下,所以在test文件名前加上其路径,且将文件输出到Seqs目录中

image.png
即输入代码:
spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ~/Seqs/SPAdesout_7942_new
--注:pe1指第一个pe文库,pe1-1是指第一个pe文库的正向,pe1-2是指第一个pe文库的反向

2、运行成功后,进入Seqs中查看:多了一个SPAdesout_7942_new文件
image.png

其中的contigs.fasta文件为quast处理文件

Velvet组装

velvet的使用分为两步:第一步是velveth利用数据构建一个hash表,第二步是velvetg进行序列拼接

1、输入代码:(用velveth命令构建一个hash表)
velveth velvet_out 31 -shortPaired -fastq -separate test_7942raw_1.fq.gz test_7942raw_2.fq.gz
(注意fq文件的路径,若文件当前目录下,则可不用输入路径)

SPAdes与Velvet拼接序列 及QUAST评价两者差异_第1张图片
image.png

2、输入代码:(用velvetg命令进行组装)
velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes

3、就可以看到目录下生成velvet.out文件
image.png

其中的contigs。fa为quast处理文件

QUAST判断两个软件的评价效果

①spades

1、输入代码:
quast.py ~/Seqs/SPAdesout_7942/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out
结果显示在/Seqs/SPAdesout_7942/quast_out/下

SPAdes与Velvet拼接序列 及QUAST评价两者差异_第2张图片
image.png

2、在linux下打开report文件
less report.txt
SPAdes与Velvet拼接序列 及QUAST评价两者差异_第3张图片
image.png

②velvet

1、输入代码:
quast.py ~/Seqs/velvet_out/contigs.fa -o ~/Seqs/velvet_out/quast_out
输出结果在/Seqs/velvet_out/quast_out/下

SPAdes与Velvet拼接序列 及QUAST评价两者差异_第4张图片
image.png

2、打开report文件
SPAdes与Velvet拼接序列 及QUAST评价两者差异_第5张图片
image.png

③比较

1、输入代码:./表示在当前目录下,使用的文件和输出都在当前目录下
quast.py -o compare_spa_velvet ./SPAdesout_7942_new/contigs.fasta ./velvet_out/contigs.fa
如图

image.png
2、运行成功后可以看到该目录下多出一个compare_spa_velvet,即为比较的结果
image.png

3、查看比较结果,打开report.txt文件。两个软件拼接结果整合在一起
less report.txt
SPAdes与Velvet拼接序列 及QUAST评价两者差异_第6张图片
image.png
根据出来的n50和max contig长度来判断拼接的效果

你可能感兴趣的:(SPAdes与Velvet拼接序列 及QUAST评价两者差异)