linux批量下载SRA数据并完成数据转换

最近在收集NCBI中的相关数据,进行meta分析,探讨石油污染对土壤微生物群落在系统发育层面的影响。


目录结构

每个文件中都有对应的SRR_Acc_List.txt文件记录了相对应的序列文件SRR***,格式统一,执行的操作一致,所以可以进行批量操作

在当前目录所有文件夹下,统一新建SRA和fastq子文件夹,下载序列文件至各目录下的SRA子文件夹,然后将序列文件转换成fastq文件

for file in $(ls)  #获取当前目录下的多个文件夹
do
mkdir ${file}/{SRA,fastq} -p #在各个文件夹下新建SRA和fastq两个子文件夹

for line in $(cat ${file}/SRR_Acc_List.txt) #获取每个文件夹中SRR**
do
prefetch ${line} -O ${file}/SRA #下载到对应文件夹的SRA子文件夹中
fastq-dump ${file}/SRA/* --split-3 -O ${file}/fastq #完成数据格式转换,并输出到对应的fastq子文件夹中
done

done
执行中...

你可能感兴趣的:(linux批量下载SRA数据并完成数据转换)