根据SRR号下载sra数据

本文主要介绍下载sra的常用的方式,并且经历多重磨炼才得到自认为较为可靠的方式

1. wget下载:

wget  ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/ERP/ERP002/ERP002469/ERR260132/ERR260132.sra   单个文件下载,不是批量下载

wget -i sra_list3.txt  ##sra_list3.txt是SRR所有列表,需注意,改TXT文件中包含的应是每个数据的下载网址。如:ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/类似这种。

备注:sra_list3.txt可通过NCBI下载,CSV格式文件获得。

缺点:当数据量很多的时候不建议用wget下载,真的是非常的慢!!!

优点:下载过程中如若出现错误,系统会重新下载该数据。

2.利用sratoolkit中的prefetch下载:

/home/liuyuxia/sratoolkit/sratoolkit.2.9.6-centos_linux64/bin/prefetch --option-file sra_list2.txt

优点:可批量下载。   

缺点:该法下载是按顺序下载,其过程中有些数据的网址解析有误,导致无法正常下载,会跳过无法下载的数据,继续进行下一个数据的下载)若下载的数据很多,有些下载成功,有些不成功。目前只能用到一种笨办法(你也可以找找别的方法),将很多的数据集拆分成多个小的txt文件,每次下载完成后,比对,看哪些数据未下载成功,将哪些没成功的数据重新单个用该命令下载。

3.利用迅雷软件可批量下载 

首先,得到每个数据下载网址,如:http/ftp//:如下图

优点:可批量下载,下载过程中不中断,下载文件完整,速度一般,和prefetch差不多。

如下是下载方式。

根据SRR号下载sra数据_第1张图片

4.群辉synology下载sra数据

downloadstation→点击网址下载,用获得数据网址进行批量下载如图所示。


根据SRR号下载sra数据_第2张图片

你可能感兴趣的:(根据SRR号下载sra数据)