IgBLAST本地化教程

搜了很多教程,发现最后多少都会有一些问题导致本地化不成功,经过我不懈的探索,最后终于成功了。

首先第1步:先下载NCBI IgBLAST

wget https://ftp.ncbi.nih.gov/blast/executables/igblast/release/LATEST

打开LATEST会看到许多包,选择适合自己的,我选择的就是图中画线的版本

IgBLAST本地化教程_第1张图片

确认好版本之后开始进行下载:

wget https://ftp.ncbi.nih.gov/blast/executables/igblast/release/LATEST/ncbi-igblast-1.21.0-x64-linux.tar.gz

第2步,下载完之后进行解压缩

tar -xvf ncbi-igblast-1.21.0-x64-linux.tar.gz

解压缩完之后就是这样一个目录

IgBLAST本地化教程_第2张图片

 

第3步,去下载IMGT数据库中的数据,这里我直接用了github中整理好的链接

wget -r -np -L https://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/

第4步,然后在ncbi-igblast-1.21.0目录下创建一个database文件夹,然后找到第3步下载到的www.imgt.org文件夹,然后找到www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/IG/IGHD.fasta这个文件,然后右键复制这个文件的地址替换掉下方代码文件的位置。然后进入到ncbi-igblast-1.21.0目录下运行下方代码。(重复三次)

./bin/edit_imgt_file.pl [文件IGHV.fasta的位置] > ./database/human_gl_V.fasta
./bin/edit_imgt_file.pl [文件IGHJ.fasta的位置] > ./database/human_gl_J.fasta
./bin/edit_imgt_file.pl [文件IGHD.fasta的位置] > ./database/human_gl_D.fasta

第5步,在ncbi-igblast-1.21.0目录下运行

./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_J.fasta
./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_V.fasta
./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_D.fasta

 第6步,在ncbi-igblast-1.21.0新建一个test文件夹,然后创建一个test.fasta文件存放下方测试序列

>10E8
GAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTGAAGCCTGGAGGATCCCTTAGACTCTCATGTTCAGCCTCTGGTTTCGACTTCGATAACGCCTGGATGACTTGGGTCCGCCAGCCTCCAGGGAAGGGCCTCGAATGGGTTGGTCGTATTACGGGTCCAGGTGAAGGTTGGTCAGTGGACTATGCTGCACCCGTGGAAGGCAGATTTACCATCTCGAGACTCAATTCAATAAATTTCTTATATTTGGAGATGAACAATTTAAGAATGGAAGACTCAGGCCTTTACTTCTGTGCCCGCACGGGAAAATATTATGATTTTTGGAGTGGCTATCCGCCGGGAGAAGAATACTTCCAAGACTGGGGCCGGGGCACCCTGGTCACCGTCTCCTCAGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTGAAGCCTGGAGGATCCCTTAGACTCTCATGTTCAGCCTCTGGTTTCGACTTCGATAACGCCTGGATGACTTGGGTCCGCCAGCCTCCAGGGAAGGGCCTCGAATGGGTTGGTCGTATTACGGGTCCAGGTGAAGGTTGGTCAGTGGACTATGCTGCACCCGTGGAAGGCAGATTTACCATCTCGAGACTCAATTCAATAAATTTCTTATATTTGGAGATGAACAATTTAAGAATGGAAGACTCAGGCCTTTACTTCTGTGCCCGCACGGGAAAATATTATGATTTTTGGAGTGGCTATCCGCCGGGAGAAGAATACTTCCAAGACTGGGGCCGGGGCACCCTGGTCACCGTCTCCTCA
>CH04
GAGGTTCAGCTGGTGGAGTCTGGGGGAGGTCTCATACGGCCGGGGGGGTCCCTGAGACTCTCCTGTAAAGGCTCCGGTTTCATCTTTGAGAATTTTGGCTTCGGCTGGGTCCGCCAAGGTCCAGGGAAGGGGCTGGAGTGGGTGTCTGGCACTAATTGGAATGGAGGTGACTCACGTTATGGAGACTCTGTGAAGGGCCGATTCACAATCTCCAGAGACAACAGCAACAATTTCGTCTACCTGCAAATGAACAGTCTGAGACCCGAGGACACGGCCATATATTATTGTGCGAGAGGGACCGATTACACTATTGACGATCAGGGGATCCGTTATCAAGGTTCGGGGACTTTCTGGTACTTCGATGTCTGGGGCCGCGGCACCCTGGTCACGGTCTCCTCAGGAGGTTCAGCTGGTGGAGTCTGGGGGAGGTCTCATACGGCCGGGGGGGTCCCTGAGACTCTCCTGTAAAGGCTCCGGTTTCATCTTTGAGAATTTTGGCTTCGGCTGGGTCCGCCAAGGTCCAGGGAAGGGGCTGGAGTGGGTGTCTGGCACTAATTGGAATGGAGGTGACTCACGTTATGGAGACTCTGTGAAGGGCCGATTCACAATCTCCAGAGACAACAGCAACAATTTCGTCTACCTGCAAATGAACAGTCTGAGACCCGAGGACACGGCCATATATTATTGTGCGAGAGGGACCGATTACACTATTGACGATCAGGGGATCCGTTATCAAGGTTCGGGGACTTTCTGGTACTTCGATGTCTGGGGCCGCGGCACCCTGGTCACGGTCTCCTCAG
>PG16
CAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGCCAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGCCAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGC
>vFP7.05
CAGGTTCAACTGCAGCAGTCTGGGGCTGAGCTGGCGAGGCCTGGGACTTCAGTGACGCTGTCCTGCAAGGCTTCGGGCTACACATTTACTGACTATGAAATGCACTGGGTGAAGCAGACACCTGTGCATGGCCTGGAATGGATTGGAGCTATTGTTCCTGAAACTGGTTTTACTGCCTACACTCAGAAGTTCAAGGGCAAGGCCATAATGACTGCAGACAAATCCTCCAGCACAGTCCAAATGGAGCTCCGCAGCCTGACATCTGAGGACGCTGCCGTCTATTACTGTTCACGATTGCGCCTCTACTGGTACTTCGATGTCTGGGGCACAGGGACCACGGTCACCGTCTCCTCA

第7步,在ncbi-igblast-1.21.0目录下运行代码

./bin/igblastn -germline_db_V database/human_gl_V.fasta -germline_db_J database/human_gl_J.fasta -germline_db_D database/human_gl_D.fasta -organism human -query test/test.fasta -auxiliary_data optional_file/human_gl.aux -show_translation > igblast_test.txt

第8步,在ncbi-igblast-1.21.0目录下面就会生成一个igblast_test.txt,里面就有比对的结果。

如果以上对你有帮助的话,希望你可以帮我点个赞和收藏,希望大家多多关注我!

你可能感兴趣的:(linux,服务器,运维)