单个基因的生物信息学分析(2)-蛋白质结构域预测

本期的主题仍然属于《单个基因的生物信息学分析》,主要讲解介绍一下单个蛋白质结构域分析。

网站链接如下:InterPro

打开主页面显示如图1,注意的是,一次只能进行一个蛋白序列的预测,且长度不超过40000个氨基酸残基。


图1

这里选择示例序列,run一下。

图2是结果部分,有三个部分,

图3

export 选项可以把比对结果以图片的形式展现出来,可以看到该序列包含的family, domain, homologous superfamily, conserved site, unintegrated

图4

以及该序列涉及到的GO调控通路。图5.

图5


图6显示了entries,包含了这些结构域在不同数据库的收录情况,其中我们看一下在pfam数据库。

图6

有6个在pfam数据库。我们将示例数据在pfam数据库进行验证,

pfam数据库链接Pfam: Search Pfam

图7

可以看到pfam数据库也包括6个相同的家族,表明我们的分析结果可靠性。

图8

因此,在进行蛋白结构域预测的时候,可以考虑使用interproscan和pfam同时进行分析,这样可信度更高。

你可能感兴趣的:(单个基因的生物信息学分析(2)-蛋白质结构域预测)