Aspera
Linux
安装
conda 安装
在Linux上安装Aspera,方便的还是直接通过conda
进行安装(已经安装了Anaconda),在需要安装的环境下输入以下命令进行安装:
$ conda install -c hcc aspera-cli -y
查看是否安装成功
# 有输出帮助文档则安装成功
$ ascp -h
查找密钥(下面使用会用到)
$ which ascp # 输出下面内容,不同环境不一样,根据自己的来
~/software/miniconda3/envs/test/bin/ascp
把bin
及bin
后面的内容换成etc/asperaweb_id_dsa.openssh
可以用ls
验证一下是否存在。
$ ls ~/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh
/home/wwwdj/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh
自己安装
(conda 安装好了可以跳过了~)
若是要自己去官网下载软件来安装的话,这是下载命令,链接:
https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
上面命令里的下载链接是当前最新版本3.11的,这篇文章发布后,可能会出现新版本。若需要可去官网下载。
下面这个链接包含了各个平台的软件包,不过可能需要注册账号登录才能获取下载链接。
https://www.ibm.com/support/fixcentral/swg/selectFixes?parent=ibm~Other%20software&product=ibm/Other+software/IBM+Aspera+Connect&release=All&platform=All&function=all
以上面那个3.11版本的为例。
下载
$ wget https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
解压
$ tar -zxvf ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
安装
## sh文件上一步解压生成的
$ ./ibm-aspera-connect-3.11.0.5-linux-g2.12-64.sh
设置环境变量
# 把USERNAME 换成自己的linux 账户名
$ echo """export PATH=\"/home/USERNAME/.aspera/connect/bin:\$PATH\" """ >> ~/.bashrc
使之立即生效
$ source ~/.bashrc
查看是否安装成功
# 有输出帮助文档则安装成功
$ ascp -h
基本语法
基本语法如下,[OPTION]
是参数设置,SRC
是远程资源路径,DEST
是文件保存路径。若SRC
为多个文件,则保存在DEST
目录下。
ascp [OPTION] SRC... DEST
以一个例子作为说明
$ ascp -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz ./test.fq.gz
参数 | 说明 |
---|---|
-l | 最大传输速率 |
-i | 密钥地址,自己安装都是:~/.aspera/connect/etc/asperaweb_id_dsa.openssh ,conda安装参照上面内容 |
-P | -P33001,分开合起作用都是一样。设成其他可能会要输密码。Set the TCP port used for fasp session initiation. (Default: 22) |
-Q | Enable fair transfer policy |
-k | -k2, 分开合起作用都是一样,异常中断可以重启。Enables fatal transfer restarts. |
-T | 禁止加密。Disable encryption for maximum throughput. |
SRC | 位置参数,源文件地址,类似[email protected]:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz |
DEST | ./test.fq.gz, 保存地址 |
参数啥的,我也没整明白。上面参数及说明参考ebi官网 https://www.ebi.ac.uk/ega/about/ftp-aspera,
更多的参数设置参考 https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html
EBI数据下载
之前aspera是可以下载DDBJ,EBI,NCBI三大数据库的数据的。不过现在,由于NCBI数据迁移至云服务器了,可能不太好使了。DDBJ也是可以的,但不是国内似乎用ddbj的人不怎么用,不过它也不太好用。
三大数据库,若使用apera下载数据的话,现在应是ebi的最好使,它也直接给了apera下载地址。
下面以PRJNA392105(SRP110599 )项目数据为例,演示下载。
ebi 的更直观一些,直接打开网址,输入框输入Accession号就能很容易查到数据了,然后相关信息也很全,下载链接直接就给了。
浏览器输入以下url就可以跳到相应页面(手动在ebi官网输入框输入PRJNA392105查询也可以~)
https://www.ebi.ac.uk/ena/browser/view/PRJNA392105
打开页面后,把网页往下滑一下能看到一下页面(可能刚打开,还没加载完,得等一会儿才能看到)点Download All
可以把所有样本的信息给下载了。方便用于批量下载。
滑动下面的滑动条,能看到FASTQ Aspera
,这就是aspera下载链接。若没有看到,可点击右上角的倒三角图样,把fastq_aspera
勾选了。其他的信息按自己要求也可以勾选。
这里就以单个文件为例演示下载。
这是上面图片看到第一个aspera下载链接。
# :前为服务器地址,:后为资源地址
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz
构建下载命令时,需要在下载链接前加上ebi 给的公共账户名era-fasp
(好像是)
如下:
$ ascp -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz
取别名
上面的命名,有些参数,基本每次都不会变动的。而每次都要输一遍,又很麻烦,因此可以用alias
固定几个参数,取一个别名。
运行以下命令
$ echo "alias ascpp=\"ascp -QT -P33001 -k2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh\"" >> ~/.bashrc
$ source ~/.bashrc
以上命令,利用alias
给ascp添加了几个参数(可自行设定,这里因为-l 可能会经常变动,没加上它),赋给了新的命令 ascpp
,原来的ascp
也是可以用的。
再次下载数据,命令就简短许多了:
$ ascpp -l 100M [email protected]:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz
test.fq.gz 100% 1066MB 97.2Mb/s 03:57
Completed: 1092464K bytes transferred in 237 seconds
(37695K bits/sec), in 1 file.
DDBJ数据下载
DDBJ虽然不太好用,而且现在也没有提供fastq下载地址,不过可能也有人需要下载,这里简单说一下。
下面是一个下载测试
看起来下载速度还不错吧。
还是以上面的PRJNA392105(SRP110599 )为例,打开ddbj数据查询网页
https://ddbj.nig.ac.jp/DRASearch/
在页面
Accession
后输入SRP110599,输入PRJNA392105查询不到的。
返回页面如下
然后,按图点击操作(仅做演示,随意下载。)
得到链接后类似这样
ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra
链接改一下变成下面这样
[email protected]:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra
下载命令为:
$ ascpp -l 1000M [email protected]:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra ./test.sra
其他
aspera有的时候是挺快的…不过我感觉容易出问题٩(͡๏̯͡๏)۶
比如一开始下载很快啊,下着下着网速就慢下来了。什么验证失败啥的…
有时,当验证失败时,可尝试换个网络环境使用。
(之前写了个批量下载脚本下载…过了一晚上,第二天来看,发现没下到几个数据。
人生苦短,及时转向…aspera不能用,就转向迅雷,ftp下载吧
参考
https://www.ebi.ac.uk/ega/about/ftp-aspera
https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html