多功能基因组的全基因组检测和分析

1导语


        许多基因可以在多种生物学过程或分子功能中发挥作用。在全基因组水平上鉴定多功能基因并研究其特性可以揭示支持细胞功能的分子事件的复杂性,从而使人们更好地了解细胞的功能格局。但是,迄今为止,对多功能基因(及其编码的蛋白质)的全基因组分析已经受到限制。在这里,作者介绍一种计算方法,该方法使用已知的功能注释来提取在至少两个不同的生物学过程中起作用的基因。

        对黑腹果蝇、智人和酿酒酵母数据分析结果提示,参与多个生物过程的基因具有独特的理化特性,表达范围更广,在蛋白质相互作用网络中更集中,在进化上更保守,并且更可能是必不可少的。作者还发现,多功能基因明显更可能与人类疾病有关。当针对分子功能而不是生物学过程定义多功能性时,这些相同的特征也成立。作者的分析揭示了有关多功能基因的关键特征,是朝着全基因组范围更好地了解基因多功能性迈出的一步。


2 .1多功能基因编码的蛋白质更长、结构域更多、残基残基比例更高



多功能基因编码的蛋白质更长、结构域更多、残基残基比例更高

2.总结


        2.1大多数蛋白质(至少在某种程度上)是多功能的。即使在这种情况下,以前的实验研究已经确定执行明显不同分子功能[蛋白,或影响若干不同生物过程。这些发现表明存在着具有高度功能可塑性的基因子集。越来越多的证据表明,基因多功能现象实际上非常普遍。因此,在系统级别研究多功能性可以帮助阐明细胞的功能组织。在本文中,作者介绍了一种使用现有功能注释系统地识别多功能基因的计算方法,并表明多功能基因与其他基因相比具有不同的特性。作者的工作代表了迄今为止对基因多功能性的最大规模表征,其中包括对多种生物的全基因组分析。

        2.2作者的方法专门解决了在处理GO功能注释方面的一些以前的弱点。在一些以前的出版物,GO术语注释的基因的数目的简单计数用作基因多功能[代理。但是,GO的特质可能导致相似的功能或过程在本体的不同位置分类。在作者识别多功能基因的方法中,作者明确选择了语义上不同的术语,这些术语的出现频率低于偶然发生的频率。在衡量研究偏见的影响时也要格外小心,特别是在相互作用网络特性和疾病基因的情况下;也就是说,多功能基因可能会更频繁地出现在各种实验的结果中,因此会被研究人员更积极地研究,这可能会在作者的分析中引入研究偏见。为了避免这种情况,作者主要分析高通量和全基因组数据集。在查看多功能基因与人工整理的数据的关联(例如与疾病的关联)时,可能会遭受研究偏见的困扰,作者直接纠正了这种偏见。此外,作者进行种间比较,并观察到三种不同生物之间的相似趋势,从而最大程度地减少了特定于生物的注释偏差的影响。

        2.2对基因和蛋白质功能的全面理解一直是计算生物学的主要目标。在这项工作中,作者开发了一种使用现有功能注释进行全基因组全基因组检测的计算方法。作者对跨多个生物体的基因多功能性进行了许多新颖的观察,并确认了以前的发现(包括仅存在传闻证据的许多情况)。总体而言,作者的工作有助于更好地系统地了解蛋白质组的功能领域,并且随着可获得更具体,更详细的功能基因组学数据,可以作为此方向上未来工作的基础。

                                                      ----在读博士,代谢,组学研究 王平写作欢迎转发,精彩不断,学习不断。

3数据分析代码构建过程


        3.1 基因数据下载 Gene Ontology (GO)下载每种生物的

4 参考文献


        文章网站 :https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4593560/

        文章 :Pritykin Y, Ghersi D, Singh M. Genome-Wide Detection and Analysis of Multifunctional Genes. PLoS Comput Biol. 2015;11(10):e1004467. Published 2015 Oct 5. doi:10.1371/journal.pcbi.1004467

你可能感兴趣的:(多功能基因组的全基因组检测和分析)