构建本地化nr nt库


写在前面。

nr.*tar.gz # Non-redundant protein sequences from GenPept, Swissprot, PIR, PDF, PDB, and NCBI RefSeq
nt.*tar.gz # Partially non-redundant nucleotide sequences from all traditional divisions of GenBank, EMBL, and DDBJ excluding GSS,STS, PAT, EST, HTG, and WGS.
----http://www.cnblogs.com/leezx/p/6425620.html?utm_source=itdadao&utm_medium=referral


1.下载nr,nt包

  • Filezilla在ncbi数据库下载nr、nt包(nr.gz,nr.gz.md5,nt.gz,nt.gz.md5)
    解压:
nohup gunzip nr &
nohup gunzip nt &
  • md5值校验文件完整性。两个包一个27GB,另外一个35GB,也不算小,用md5值校验,安心。
md5sum nr.gz
md5sum nt.gz
[root@xxx nr_nt]# md5sum nr.gz
f17f681c860d0c5d85342088f0818713  nr.gz
[root@xxx nr_nt]# cat nr.gz.md5
f17f681c860d0c5d85342088f0818713  nr.gz
[root@xxx nr_nt]# md5sum nt.gz
5d50c089a686f771d164c9e8e9a81a12  nt.gz
[root@xxx nr_nt]# cat nt.gz.md5
5d50c089a686f771d164c9e8e9a81a12  nt.gz
  • 校验结果与上述下载的两个md5文件比较。

2.本地建库.

  • 建立索引步骤放在后台运行,考虑避免建库出现错误,添加了 -logfile 函数,记录建库的过程。
    nr本地化
nohup makeblastdb -in nr -parse_seqids -hash_index -dbtype prot -logfile nr_logfile &
  • nt本地化
nohup makeblastdb -in nt -parse_seqids -hash_index -dbtype nucl -logfile nt_logfile &

yuwq
2017/4/17


现在看当年写的教程,还是太年轻了。最大的问题就是权限。我怎么能直接在root账户下做这些操作,危险系数太高了。
sudo是个好东西,只是当时没有意识到!
另外一个就是不能什么东西都一股脑用nohup丢到后台,用2>&1 > file.log这种方式 保存更利于后面到排错。

yuwq
2019/7/9


你可能感兴趣的:(构建本地化nr nt库)