关于利用脚本批量下载、转换、质控

我们进行获取数据并进行分析时,一个个的操作未免太过麻烦,因此可以利用shell脚本进行批量处理。在此利用之前老师上课讲过的生物软件来利用脚本做一个流程化处理。
首先我们明确一下操作流程
1、利用Aspera批量下载文件
2、利用FastQC语需要.fastq.gz文件,所以我们需要利用SRA-toolkits做格式转换
3、利用FastQC做质控

我的需要批量下载的序列放在sra_list.txt文件中


关于利用脚本批量下载、转换、质控_第1张图片
sra_list.txt

下面是一些结果和脚本代码

关于利用脚本批量下载、转换、质控_第2张图片

第一步结果


第一步结果

第二步结果


关于利用脚本批量下载、转换、质控_第3张图片
第二步结果

第三步结果


第三步结果

脚本运行结果


关于利用脚本批量下载、转换、质控_第4张图片
脚本运行结果

因为是在sra_list.txt中放了三个文件位置,却只下载了两条,有一条错误,我在下面也试了很多次,代码应该没有什么问题,估计可能是服务器不稳定,如果有其他什么发现,欢迎同学们告知

关于后面的序列组装SPAdes和velvet以及序列拼接评价QUAST的脚本,大家有兴趣的可以在后面添加,与此如出一辙。

今天看了俊辉的脚本发现可以对PE还是SE进行区别,大家也可以看看

你可能感兴趣的:(关于利用脚本批量下载、转换、质控)