NCBI下载nt/nr/swissprot库

NCBI下载nt/nr/swissprot库

1. 确定你要下载文件的位置

https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/

2. 进行下载

方法一:使用wget,nohup wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz 2>&1 &
方法二:使用ascp,nohup /path/.aspera/connect/bin/ascp -v -QT -l 400m -k1 -i /path/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/blast/db/FASTA/nt.gz /home/Database/nt/ 2>&1 &

3. 下载注意事项

方法一

①wget支持断点续传,若因为网络问题中断下载,可执行nohup wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz 2>&1 &,从而再次下载。
②如若不小心是用来命令nohup wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz 2>&1 &,进行下载,即使下载完成,但是下载的nt.gz文件不能进行解压(无法使用,等于白干了~~血泪教训)

给大家看图

这是下载的ftp,所以在解压时,出错
NCBI下载nt/nr/swissprot库_第1张图片
在这里插入图片描述
只能重新下载,使用https,进行加压
NCBI下载nt/nr/swissprot库_第2张图片
请添加图片描述

方法二

①安装ascp,你可以参考我的另一篇文章,也可以自行下载安装

②我发现,因为服务器的不同,这一软件运行的速率也不同。可能是150Mb/s,也有10Mb/s。请读者自行斟酌

4. 下载完成,进行解压,为makeblastdb,准备输入文件

nohup gunzip -c ./nt.gz > ./nt.fa 2>&1 &(保留原文件,以便出现问题重复下载)
注意:这里为什么一定要解压,是makeblastdb不支持压缩包输入

以上都是本人遇到的问题,如有错误,希望大家指正,共同学习

你可能感兴趣的:(生物信息学,ncbi)