搜了很多教程,发现最后多少都会有一些问题导致本地化不成功,经过我不懈的探索,最后终于成功了。
首先第1步:先下载NCBI IgBLAST
wget https://ftp.ncbi.nih.gov/blast/executables/igblast/release/LATEST
打开LATEST会看到许多包,选择适合自己的,我选择的就是图中画线的版本
确认好版本之后开始进行下载:
wget https://ftp.ncbi.nih.gov/blast/executables/igblast/release/LATEST/ncbi-igblast-1.21.0-x64-linux.tar.gz
第2步,下载完之后进行解压缩
tar -xvf ncbi-igblast-1.21.0-x64-linux.tar.gz
解压缩完之后就是这样一个目录
第3步,去下载IMGT数据库中的数据,这里我直接用了github中整理好的链接
wget -r -np -L https://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/
第4步,然后在ncbi-igblast-1.21.0目录下创建一个database文件夹,然后找到第3步下载到的www.imgt.org文件夹,然后找到www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/IG/IGHD.fasta这个文件,然后右键复制这个文件的地址替换掉下方代码文件的位置。然后进入到ncbi-igblast-1.21.0目录下运行下方代码。(重复三次)
./bin/edit_imgt_file.pl [文件IGHV.fasta的位置] > ./database/human_gl_V.fasta
./bin/edit_imgt_file.pl [文件IGHJ.fasta的位置] > ./database/human_gl_J.fasta
./bin/edit_imgt_file.pl [文件IGHD.fasta的位置] > ./database/human_gl_D.fasta
第5步,在ncbi-igblast-1.21.0目录下运行
./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_J.fasta
./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_V.fasta
./bin/makeblastdb -parse_seqids -dbtype nucl -in ./database/human_gl_D.fasta
第6步,在ncbi-igblast-1.21.0新建一个test文件夹,然后创建一个test.fasta文件存放下方测试序列
>10E8
GAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTGAAGCCTGGAGGATCCCTTAGACTCTCATGTTCAGCCTCTGGTTTCGACTTCGATAACGCCTGGATGACTTGGGTCCGCCAGCCTCCAGGGAAGGGCCTCGAATGGGTTGGTCGTATTACGGGTCCAGGTGAAGGTTGGTCAGTGGACTATGCTGCACCCGTGGAAGGCAGATTTACCATCTCGAGACTCAATTCAATAAATTTCTTATATTTGGAGATGAACAATTTAAGAATGGAAGACTCAGGCCTTTACTTCTGTGCCCGCACGGGAAAATATTATGATTTTTGGAGTGGCTATCCGCCGGGAGAAGAATACTTCCAAGACTGGGGCCGGGGCACCCTGGTCACCGTCTCCTCAGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTGAAGCCTGGAGGATCCCTTAGACTCTCATGTTCAGCCTCTGGTTTCGACTTCGATAACGCCTGGATGACTTGGGTCCGCCAGCCTCCAGGGAAGGGCCTCGAATGGGTTGGTCGTATTACGGGTCCAGGTGAAGGTTGGTCAGTGGACTATGCTGCACCCGTGGAAGGCAGATTTACCATCTCGAGACTCAATTCAATAAATTTCTTATATTTGGAGATGAACAATTTAAGAATGGAAGACTCAGGCCTTTACTTCTGTGCCCGCACGGGAAAATATTATGATTTTTGGAGTGGCTATCCGCCGGGAGAAGAATACTTCCAAGACTGGGGCCGGGGCACCCTGGTCACCGTCTCCTCA
>CH04
GAGGTTCAGCTGGTGGAGTCTGGGGGAGGTCTCATACGGCCGGGGGGGTCCCTGAGACTCTCCTGTAAAGGCTCCGGTTTCATCTTTGAGAATTTTGGCTTCGGCTGGGTCCGCCAAGGTCCAGGGAAGGGGCTGGAGTGGGTGTCTGGCACTAATTGGAATGGAGGTGACTCACGTTATGGAGACTCTGTGAAGGGCCGATTCACAATCTCCAGAGACAACAGCAACAATTTCGTCTACCTGCAAATGAACAGTCTGAGACCCGAGGACACGGCCATATATTATTGTGCGAGAGGGACCGATTACACTATTGACGATCAGGGGATCCGTTATCAAGGTTCGGGGACTTTCTGGTACTTCGATGTCTGGGGCCGCGGCACCCTGGTCACGGTCTCCTCAGGAGGTTCAGCTGGTGGAGTCTGGGGGAGGTCTCATACGGCCGGGGGGGTCCCTGAGACTCTCCTGTAAAGGCTCCGGTTTCATCTTTGAGAATTTTGGCTTCGGCTGGGTCCGCCAAGGTCCAGGGAAGGGGCTGGAGTGGGTGTCTGGCACTAATTGGAATGGAGGTGACTCACGTTATGGAGACTCTGTGAAGGGCCGATTCACAATCTCCAGAGACAACAGCAACAATTTCGTCTACCTGCAAATGAACAGTCTGAGACCCGAGGACACGGCCATATATTATTGTGCGAGAGGGACCGATTACACTATTGACGATCAGGGGATCCGTTATCAAGGTTCGGGGACTTTCTGGTACTTCGATGTCTGGGGCCGCGGCACCCTGGTCACGGTCTCCTCAG
>PG16
CAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGCCAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGCCAGGAACAACTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCGGGGGGGTCCCTGAGACTCTCCTGTTTAGCGTCTGGATTCACGTTTCACAAATATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGCCTGGAGTGGGTGGCACTCATCTCAGATGACGGAATGAGGAAATATCATTCAGACTCCATGTGGGGCCGAGTCACCATCTCCAGAGACAATTCCAAGAACACTCTTTATCTGCAATTCAGCAGCCTGAAAGTCGAAGACACGGCTATGTTCTTCTGTGCGAGAGAGGCTGGTGGGCCAATCTGGCATGACGACGTCAAATATTACGATTTTAATGACGGCTACTACAACTACCACTACATGGACGTCTGGGGCAAGGGGACCACGGTCACCGTCTCGAGC
>vFP7.05
CAGGTTCAACTGCAGCAGTCTGGGGCTGAGCTGGCGAGGCCTGGGACTTCAGTGACGCTGTCCTGCAAGGCTTCGGGCTACACATTTACTGACTATGAAATGCACTGGGTGAAGCAGACACCTGTGCATGGCCTGGAATGGATTGGAGCTATTGTTCCTGAAACTGGTTTTACTGCCTACACTCAGAAGTTCAAGGGCAAGGCCATAATGACTGCAGACAAATCCTCCAGCACAGTCCAAATGGAGCTCCGCAGCCTGACATCTGAGGACGCTGCCGTCTATTACTGTTCACGATTGCGCCTCTACTGGTACTTCGATGTCTGGGGCACAGGGACCACGGTCACCGTCTCCTCA
第7步,在ncbi-igblast-1.21.0目录下运行代码
./bin/igblastn -germline_db_V database/human_gl_V.fasta -germline_db_J database/human_gl_J.fasta -germline_db_D database/human_gl_D.fasta -organism human -query test/test.fasta -auxiliary_data optional_file/human_gl.aux -show_translation > igblast_test.txt
第8步,在ncbi-igblast-1.21.0目录下面就会生成一个igblast_test.txt,里面就有比对的结果。
如果以上对你有帮助的话,希望你可以帮我点个赞和收藏,希望大家多多关注我!