在Windows系统中搭建本地Blast序列比对环境

在实验室中,我们经常需要对分子生物学数据进行分析,常见的有DNA和蛋白质分子序列比对。分子序列比对分为全局序列比对和局部序列比对两种情况。其具体算法我们将在以后的文章中详细介绍。局部序列比对即我们常用的NCBI上的Blast工具。在生物信息数据分析中,也经常要进行Blast比对,从而进行序列注释。然而,利用网页序列比对不能做到批量比对和大量数据比对,因此需要本地化序列比对,在本地计算机进行比对计算。

本文讲解如何在Windows系统中搭建本地Blast序列比对环境。

  1. 下载与安装Blast
    1.1 Blast软件包下载地址:
    ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

     ncbi-blast-2.9.0+-win64.exe
    

1.2 安装软件包
双击安装程序,选择“I agree”


install blast.PNG

选择安装目录(我自己喜欢默认安装到D盘)


在Windows系统中搭建本地Blast序列比对环境_第1张图片
install blast2.PNG

运行结束后,打开命令行,输入blastp -h
即可看到帮助命令

在Windows系统中搭建本地Blast序列比对环境_第2张图片
test blast.PNG

注释:若不能出现帮助命令,可手动在系统变量里面添加Blast目录地址,从而添加blast程序到系统变量。

  1. 构建本地数据库
    安装Blast软件包后,系统命令即可启动blastn等命令,但是blastn等命令需要数据库作为比对目标,因此需要构建本地数据库。

注释:真正的数据分析时,需要从NCBI下载NR数据库,然后构建本地数据库。
2.1 下载数据库或自备数据库序列文件


在Windows系统中搭建本地Blast序列比对环境_第3张图片
test_protein_library.PNG

2.2 格式化数据库

2.2.0 makeblastdb 帮助信息

在Windows系统中搭建本地Blast序列比对环境_第4张图片
makeblastdb help.PNG

2.2.1 构建格式化数据库

在Windows系统中搭建本地Blast序列比对环境_第5张图片
makeblastdb library.PNG

构建成功后会出现多个文件

在Windows系统中搭建本地Blast序列比对环境_第6张图片
makeblastdb library results.PNG
  1. 序列比对
    3.1 准备分析序列文件
    序列文件需为fasta格式:
>sequence name
AGCTGCGATGACGTAG

例如


在Windows系统中搭建本地Blast序列比对环境_第7张图片
test_protein.PNG

3.2 将序列文件放置到工作目录下
D:\db\test_Protein

3.3 运行blast程序


blast protein sequence.PNG

3.4 运行程序后就可在目录下得到比对结果文件

文件内容

在Windows系统中搭建本地Blast序列比对环境_第8张图片
blast results.PNG

你可能感兴趣的:(在Windows系统中搭建本地Blast序列比对环境)