NCBI中SRA文件的下载

参考
Aspera工具安装与使用
NCBI下载sra数据

FTP下载

Windows环境

在Windows环境下直接进入NCBI的FTP下载界面,按照需要下载的SRA文件ID找到储存位置即可


NCBI中SRA文件的下载_第1张图片

NCBI中SRA文件的下载_第2张图片

如需要下载SRR5483089文件,其下载地址如下:

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483089

其规律如下:

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/+SRR+登陆号前三位数字(548)+/SRR+完整登陆号(5483089)

Linux环境

Linux环境下可以直接根据下载地址的规律使用wget或其他命令行下载工具下载。

使用Aspera快速下载

Aspera是IBM公司的一款高速传输软件,其传输速度非常快,在实际使用中可以达到10-20Mb/s的传输速度。

Windows环境

在Windows环境下,可以直接下载安装Aspera-connect。然后进入NCBI的Aspera专用的下载地址进行下载


NCBI中SRA文件的下载_第3张图片

其文件储存结构和FTP类似。

Linux环境

在Linux环境中,在官方网站下载Aspera-connect的Linux版本,解压后直接使用bash安装

wget https://download.asperasoft.com/download/sw/connect/3.9.1/ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.tar.gz
tar zxvf ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.tar.gz
bash ibm-aspera-connect-3.9.1.171801-linux-g2.12-64.sh

此时,Aspera已经被安装在.aspera中,将/home/user/.aspera/bin加入环境变量

export PATH="/home/user/.aspera/connect/bin:$PATH"

也可以将上述命令加入~/.bashrc文件的结尾并使用source ~/.bashrc,将其设置为自动添加到环境变量中
需要注意其密钥文件协议文件的位置,协议文件需要拷贝至bin目录中

~/.aspera/connect/etc/asperaweb_id_dsa.openssh
sudo cp ~/.aspera/connect/etc/aspera-license /usr/local/bin/

使用Aspera下载SRR5483089

ascp -i .aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/sra/sra-instant/reads/ByExp/sra/SRR/SRR548/SRR5483089 .

使用prefetch获取SRA文件

同样的,我们也可以使用NCBI提供的SRA工具中的prefetch工具来下载SRA文件,他也会自动调用在环境变量中的Aspera,如果不存在则会使用普通的下载方式来下载。
sra-toolkit可以使用conda安装或是在NCBI下载解压使用
prefetch可以读取文本文件中的accession number来完成多个SRA文件的批量下载,其格式如下

SRR0000001
SRR0000002
SRR0000003
SRR0000004
SRR0000005

使用perfetch调用accession number文本下载SRA文件

prefetch --option-file SRR_Acc_List.txt

你可能感兴趣的:(NCBI中SRA文件的下载)