SRA数据(1)------SRA数据下载

一.prefetch下载:

安装SRA Toolkit:

1.下载Toolkit:进入下面的网址,选择适合自己电脑的版本下载,网速不好的推荐挂后台,80M左右,不大。

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software


SRA数据(1)------SRA数据下载_第1张图片


2.解压安装: tar -zxvf     文件名

$ tar -zxvf sratoolkit.2.10.0-centos_linux64.tar.gz

sratoolkit.2.10.0-centos_linux64/

sratoolkit.2.10.0-centos_linux64/bin/

sratoolkit.2.10.0-centos_linux64/bin/abi-dump

sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2

sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2.10.0

sratoolkit.2.10.0-centos_linux64/bin/abi-load

sratoolkit.2.10.0-centos_linux64/bin/abi-load.2

sratoolkit.2.10.0-centos_linux64/bin/abi-load.2.10.0

sratoolkit.2.10.0-centos_linux64/bin/align-info

sratoolkit.2.10.0-centos_linux64/bin/align-info.2

...

3.配置环境:最好先pwd先查看自己的具体路径,避免出错,配置好之后可以 prefetch -V查看一下是否路径添加成功.

$ ls

sratoolkit.2.10.0-centos_linux64  sratoolkit.2.10.0-centos_linux64.tar.gz

$ cd sratoolkit.2.10.0-centos_linux64/

$ ls

bin  CHANGES  example  README-blastn  README.md  README-vdb-config  schema

$ cd bin

$ pwd

/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin

$ echo 'export export PATH=$PATH:/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin' >> ~/.bash_profile

$ source ~/.bash_profile

$ prefetch -V

/home/user/test/sratoolkit.2.10.0-centos_linux64/bin/prefetch : 2.10.0

4.prefetch 单个数据下载:

    以SRR548905为例:

$ prefetch SRR5489805

2020-01-14T05:42:57 prefetch.2.10.0: 1) Downloading 'SRR5489805'...

2020-01-14T05:42:57 prefetch.2.10.0: Downloading via https...

...

5.prefetch批量下载数据:

    获取Accession List:

        进入NCBI的SRA数据库输入SRP号:

SRA数据(1)------SRA数据下载_第2张图片
获取Accession List'

    Accession List大概长这个样子:


SRA数据(1)------SRA数据下载_第3张图片
Accession List

$ prefetch --option-file SraAccList.txt

下载完成后,文件被存储在默认目录:/home/usr/ncbi/public/sra/

二.wget 下载(推荐):

1.wget 单个数据下载:以SRR5489805为例,建议挂后台,如果网速给力的话就直接下.

    获取下载地址:


SRA数据(1)------SRA数据下载_第4张图片
获取SRR数据下载地址
SRA数据(1)------SRA数据下载_第5张图片
获取SRR数据下载地址

$ wget https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805 &

[1] 29674

$ --2020-01-14 14:16:05-- https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805

正在解析主机 sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)... 130.14.250.24, 130.14.250.25, 130.14.250.28

正在连接 sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)|130.14.250.24|:443... 已连接。

已发出 HTTP 请求,正在等待回应... 200 OK

长度:3491558416 (3.3G) [application/octet-stream]

正在保存至: “SRR5489805.1” 0% [ ] 646,937 188KB/s 剩余 5h 1m


2.wget批量下载数据:

    获取下载地址:在Send to下选择Runinfo而不是Accession List:


SRA数据(1)------SRA数据下载_第6张图片
获取批量下载的地址

文件大概长这个样子:


SRA数据(1)------SRA数据下载_第7张图片
Runinfo文件


然后把这些下载地址保存在一个新的文件中:


SRA数据(1)------SRA数据下载_第8张图片
下载地址

然后利用wget -i 文件 直接下载:

$ nohup wget -i download_path.txt &

[1] 30328

$ nohup: 忽略输入并把输出追加到"nohup.out"

SRA数据的下载方式还有很多,但是我个人比较推荐wget直接下载,挂后台稳定高效,大家也可以搜索一下其它的下载方式,找到一个适合自己的。

SRA数据下载就只能分享这么多了,希望各位大佬多多批评指教。

下一期预告:SRA数据(2)------SRA数据处理

你可能感兴趣的:(SRA数据(1)------SRA数据下载)