Aspera 下载SRA数据

之前提到Aspera 上传基因组数据到NCBI,本次学习如何利用Aspera快速下载SRA数据。

Aspera用法如下:
Usage: ascp [参数] 目标文件 保存路径
-v verbose mode 唠叨模式,能让你实时知道程序在干啥,方便查错。有些作者的程序缺乏人性化,运行之后,只见光标闪,压根不知道运行到哪了
-T 取消加密,否则有时候数据下载不了
-i 提供私钥文件的地址,不能少,地址一般是~/.aspera/connect/etc中的asperaweb_id_dsa.openssh文件
-l 设置最大传输速度,一般200m到500m,如果不设置,反而速度会比较低,可能有个较低的默认值
-k 断点续传,一般设置为值1
-Q 一般加上它
-P 提供SSH port,端口一般是33001,

本次使用ENA (European Nucleotide Archive) 进行下载,这样可以直接下载到fq的数据,不用基于SRR转换。

首先,找到对应SRR文件,并下载数据的TSV格式文本


该文本含有数据的下载路径。

如果使用Aspera下载,需要对TSV中的路径做出调整, 将
变为:。从ENA下载指定域名为era-fasp. 因此可循环对TSV的文本进行下载

for n in $(cat tsv)
do
   ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
    -k1  -QT -l300m  -P 33001 \
    era-fasp@${n} ./  ## 下载到当前目录
done

你可能感兴趣的:(Aspera 下载SRA数据)