单个基因的生物信息学分析(1)-基因结构与功能分析

在生物学分析中,我们经常会针对某个基因进行生物学功能分析,比较常见的包括基因结构预测,功能注释,蛋白质结构域预测(跨膜域,信号肽),同源基因分析,多序列比对,亚细胞定位预测,启动子序列分析,调控靶基因的miRNA预测等。在“单个基因的生物信息学分析”主题中,我们主要使用的是在线网站,几乎不涉及编程等操作,这样会使跟多的同学可以方便学习。

一、针对一个特定的基因序列,首先我们要分析其基因结构。这里我们推荐的是softberry网站的子功能,即FGENESH。

该分析工具的网址如下FGENESH - HMM-based gene structure prediction

进入该网址之后,输入该基因的fasta序列,关于目标基因的fasta序列,fig.1即为所示,我们以小麦中的基因为例分析。

图1

根据fig.2所示,将fasta序列输入进去,选择小麦(triticum aestivum),然后search。

图2


图3展示了分析结果,可以看到我们这个序列比对到了正义链,因为我们用的例子是该基因的转录本,所以只包括黄色的部分,即CDSo序列,这也和我们使用的转录本相吻合。下面的是该基因对应的mRNA序列,同样也是1152bp,最下面的是将该mRNA翻译为蛋白质的序列。


图3

二、如果我们是想分析一段区间内的基因结构,例如几kb,几十kb,而不是针对特定的基因分析,同样也可以使用该网址。这里我们使用的是FGENESH的示例文件。


图4

同样选择好序列和物种,搜索,等待结果。

图5是分析结果,一共鉴定了10个基因,21个外显子,由于篇幅所限,我们只展示了前几个,但是统计的话,正好能对上数目。

图5

图6是紧接上图的具体的序列分析,总共包含10个基因。

图6

三、基于以上分析,我们可以初步得到一段区间内的基因结构分析,也可以进行单个基因的结构分析。完成基因结构分析之后,可以利用ncbi的blast,或者ensemble plant进行功能注释,如果是使用氨基酸序列,选择blastp,如果是基因序列,选择blastn。图7显示的是ensemble plant的blast,查看其在拟南芥中的同源基因。在这里,我比较推荐使用ensemble plant进行blast,因为该网址更简洁,明了。


图7

图8可以看到该基因在拟南芥中的同源基因,具体的生物学注释,就要看自己对这个基因的了解程度了。

图8

以上,就是我们这次对某段未知的基因区间以及某个特定的基因,进行结构分析和功能注释。欢迎各位小伙伴点赞,收藏和留言讨论。

你可能感兴趣的:(单个基因的生物信息学分析(1)-基因结构与功能分析)