sratoolkit下载sra数据库的微生物数据及转为Fastq格式

Linux安装sratoolkit

NCBI查看安装帮助NCBI SRA Toolkit

下载、解压安装

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

tar zxf sratoolkit.2.9.2-centos_linux64.tar.gz

数据下载

最近在看微生物文献,想找文献的数据练手,链接进原文。

进入SRA数据查询库,如作图,输入SRP编号后下载,Accession List



使用prefetch进行下载

下载完成后,会在你的工作主目录下生成一个ncbi的文件夹。

输入命令:

prefetch --option-file SRR_Acc_List.txt #批量下载

cd ncbi/public/sra #查看下载结果

PS.安装aspera后再用prefetch命令会自动调用ascp下载,速度很快,有兴趣可以自行百度查找教程。

SRA格式转化

sra转化为fastq文件可以使用sratoolkit中的fastq-dump命令。

fastq-dump --split-3 filename其中--split-3参数代表着如果是单端测序就生成一个  、.fastq文件,如果是双端测序就生成_1.fastq 和*_2.fastq 文件。

进入到sra文件中我们可以用下述代码进行批量的格式转化:

for i in *sra

do

echo $i

fastq-dump --split-3 $i

done

结果查看:

ps.批量解压sra文件,用下面命令替换上面对应部分:

fastq-dump --gzip --split-files $i

参考来源:

1、SRA批量下载及转为Fastq格式

2、SRA工具sratoolkit把原始测序数据转为fastq格式

3、NCBI SRA数据库使用详解

你可能感兴趣的:(sratoolkit下载sra数据库的微生物数据及转为Fastq格式)