基于全基因组的基因家族分析的初尝试

参考:简书https://www.jianshu.com/p/9f96fc7438aa

以搜索ZEB的人类的基因家族成员为例

一. 搜索已知数据库

1.在NCBI Gene上搜索ZEB1

基于全基因组的基因家族分析的初尝试_第1张图片

 点击summary

基于全基因组的基因家族分析的初尝试_第2张图片

点击domain

基于全基因组的基因家族分析的初尝试_第3张图片

点击Gene就可以看到有相同结构的Gene了

基于全基因组的基因家族分析的初尝试_第4张图片

 

2.在UniProtKB上下载protein family list

https://www.uniprot.org/help/family_membership

基于全基因组的基因家族分析的初尝试_第5张图片

 在UniProtKB上搜索ZEB1获取UniProtKB的ID

基于全基因组的基因家族分析的初尝试_第6张图片

在下载的文件(https://pan.baidu.com/s/1pu4eVyQKLBazyNY3RH80eg    password:ihij)中搜索P37275

基于全基因组的基因家族分析的初尝试_第7张图片 选择HUMAN的即为同家族的基因

3.或者在Ensemble数据中搜索

基于全基因组的基因家族分析的初尝试_第8张图片

点击即可查看基因家族(好像结果不是很全) 

4.或者参考    如何获取一个基因家族的所有小麦基因

https://blog.csdn.net/msw521sg/article/details/76606086

基于全基因组的基因家族分析的初尝试_第9张图片

二.通过Hmmer工具鉴别基因家族

参考:https://www.jianshu.com/p/963452cda9f1

1.下载人类的基因组

http://www.ensembl.org/info/data/ftp/index.html

得到DNA.fa   CDS.fa   protein.fa  gene.gff3

2.获取HMMer的输入文件.hmm

 

 基于全基因组的基因家族分析的初尝试_第10张图片

在pfam上搜索http://pfam.xfam.org/search#tabview=tab1

 基于全基因组的基因家族分析的初尝试_第11张图片

 基于全基因组的基因家族分析的初尝试_第12张图片

 

 对于在NCBI Gene上没有对于的PFamID 或者有多个PFamID的可以从PATHER上下载HMM文件

http://www.pantherdb.org/

基于全基因组的基因家族分析的初尝试_第13张图片

 基于全基因组的基因家族分析的初尝试_第14张图片

 

 

得到了HMMer的输入文件 .hmmer

3.运行HMMER 

HMMER的用法http://www.360doc.com/content/17/0823/08/33204118_681408029.shtml

安装:tar -zxvf hmmer.tar.gz

./configure --prefix=/home/taotao/Download/hmmer_install --enable-threads

make

make check

make install

你可能感兴趣的:(生物学软件)