HMMER-序列分析软件介绍

HMMER是一个软件包,它提供了制作蛋白质和DNA序列域家族概率模型的工具,称为轮廓隐马尔可夫模型、轮廓HMM或仅轮廓,并使用这些轮廓来注释新序列、搜索序列数据库以寻找其他同源物,以及进行深度多重序列比对。HMMER是已知蛋白质和DNA序列域家族的几种综合比对和图谱的基础,包括Pfam数据库。

网页版  https://www.ebi.ac.uk/Tools/hmmer/

conda install hmmer
# 各种安装方式。http://hmmer.org/documentation.html

# install_path/hmmer-3.3.2/tutorial  test文件位置

### 1. hmmsearch:用profile文件搜索序列数据库

## Step 1: build a profile with hmmbuild

# globins4.sto 四个珠蛋白序列的MSA比对结果,Stockholm format

hmmbuild globins4.hmm globins4.sto

# 统计对序列比对(MSA) 的HMM(隐马尔科夫) profile 
hmmstat globins4.hmm

## Step 2: search the sequence database with hmmsearch
# 下载数据库文件如 uniprot_sprot.fasta, globins45.fa为演示数据库

hmmsearch globins4.hmm globins45.fa > globins4.out

# 输出globins4.out为sequence top hits list,BLAST-like style
# E-value 期望的假阳性率

### 2  在序列数据库中迭代搜索
jackhmmer HBB_HUMAN uniprot_sprot.fasta

### 3. 用序列文件搜索profile数据库
## Step 1: create a profile database file
hmmbuild globins4.hmm globins4.sto
hmmbuild fn3.hmm fn3.sto
hmmbuild Pkinase.hmm Pkinase.sto
cat globins4.hmm fn3.hmm Pkinase.hmm > minifam

## Step 2: compress and index the flatfile with hmmpress
hmmpress minifam

## Step 3: search the profile database with hmmscan
hmmscan minifam 7LESS_DROME


参考:
http://eddylab.org/software/hmmer/Userguide.pdf

你可能感兴趣的:(生物信息学)