基因家族分析1

1.数据下载

1)基因家族模型下载

在pfam(http://pfam.xfam.org/)中下载已知的蛋白保守结构域的隐马尔科夫模型(HMM)

model.png
hmm下载.png

2)基因组数据下载

1.下载基因组文件fa   http://www.maizesequence.org/index.html

2.下载基因组注释文件(gtf,gff3,gff)ftp://ftp.ensemblgenomes.org/pub/plants/release-47/gff3/zea_mays

3)在目标基因组中寻找基因家族

1.利用hmmer软件中的hmmsearch命令搜索目标基因家族蛋白。

筛选出了51个成员(横线以上),横线以下2个不可信,保守起见确定一下。

hmm鉴定.png

2.利用TBtools得到基因id和对应序列的fasta文件

3.去NCBI进行blastp:https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome


blastp.png

点击Download All,选择下载XML格式

result.png

用TBtools把xml格式转化为table格式


工具.png
筛选结果.png

按Query_def删除重复项,筛选出47个家族成员

4.基于保守域进一步筛选


保守域.png

你可能感兴趣的:(基因家族分析1)