在线工具 OrthoVenn2 使用笔记
文字转自:https://www.sohu.com/a/338678088_652735
全基因组直系同源基因簇(Orthologousclusters)的分析是比较基因组学研究的重要步骤,鉴定直系同源簇之间的聚类及构建网络可以帮助我们解释跨多个物种的蛋白质的功能和进化关系。某一类物种全部基因「泛基因组」可分为三个部分包括核心基因组(core genome),附属基因组(accessory genome)以及特有基因(specific genes)。核心基因组即所有个体共有的保守基因家族;附属基因指存在于部分个体中的基因家族,与物种的分化有关,赋予个体竞争优势;特有基因只存在于某一个体中,通常与该个体的独特表型相关,如对特定环境的适应性或独特的致病性等。比较分析某一类物种的直系同源簇为了解基因组的动态、物种进化、环境适应性机制等提出了有用信息。
今天要介绍的这款OrthoVenn2工具,可用于多物种全基因组直系同源基因簇比较和注释,界面友好,结果丰富。OrthoVenn2 是之前版本OrthoVenn v 1.0的全新升级,性能、数据库、分析及结果展示方面都有很大的提升。OrthoVenn2基于OrthoMCL启发式匹配算法,用DIAMOND进行比对,比传统的BLAST算法速度提高了1万倍,而且相比之前的版本数据库资源更加丰富,单次在线分析的上限物种数量提高了一倍(12个)。OrthoVenn2还开发了本地版本,方便用户下载使用,且没有物种数量限制。访问网址:https://orthovenn2.bioinfotoolkits.net/home。打开主页后,点击Start开始分析。
进入开始页面后,就可以选择或者上传需要分析的基因组数据了。OrthoVenn2数据库中覆盖了植物、脊椎动物、细菌、真菌、原生生物和后生动物代表物种的基因组,选定相应数据库后,可以选择数据库中的物种。
还可以自己上传本地的基因组蛋白质序列(FASTA格式)。
提交后,会自动生成一个任务号。OrthoVenn2相比其他同类软件及其之前的版本的亮点之一就是分析速度非常快且结果准确可靠,比对分析5个普通真菌的基因组只需5分钟;比对12个大型灵长类动物的基因组,30分钟左右就可完成任务。
OrthoVenn2的结果页面非常丰富,相比之前的版本增加了不同物种同源基因簇的存在或者缺失情况的直观显示及统计信息(绿色表示存在,灰色表示缺失),还可进行个性化的结果展示。页面右侧汇总了各个参比基因组序列数、基因家族数目、单拷贝基因序列数目。可以下载序列聚类信息表以及同源基因簇的相应序列。
韦恩图展示了不同物种基因家族的交集,其中处于中心的就是所分析物种的核心基因组了,其他为不那么保守的可变基因组。韦恩图的风格可以修改,并且可以下载编辑,插入文章中(提供的图片格式包括PNG、PDF、SVG)。下面的条形图展示不同物种所含基因家族数目的比较,页面右侧还增加了基于两两比对的物种相似性矩阵(以重叠的同源基因数量作物种聚类)。结果页面上统计表以及韦恩图中的数字都可以点开,进入相应部分功能分析的页面。
点开韦恩图中的数字,会跳出详细的注释分析结果。可以查看共有该基因家族的物种,下载基因家族聚类信息表以及该共有区域的相应序列,还可以查看下载共有区域的基因家族功能分析结果。在下面的列表中有基因家族Swiss-Prot及GO(Gene Ontology)功能注释及富集分析的结果。三个饼状图展示了所选择的同源基因簇的三个主要GO功能类别的比例包括生物过程(biological processes)、分子功能(molecular functions)和细胞成分(cellular components)。
点开基因家族编号 Cluster--,可以看到详细的关于这个基因家族的聚类分析。可以查看序列信息,以及这个基因家族的相似性网络图,两条序列(节点)相似度越高,连线越粗,并且网络图中每条连线和节点都可以手动进行伸展移动。
点开Multiple Sequence Alignment(多序列比对),可以看到序列保守及多样性情况(可以个性化选择着色模式和阈值)。MEME程序对该基因家族结构域(motif)进行分析,MEME 图中字母的高度表示在每个位置上每个氨基酸出现的概率。结构域位置图中“块”的高度与 p 值成比例。
返回注释分析页面,继续查看其他相关信息,包括的生物过程(Biologicalprocess)分类汇总、分子功能(Molecular function)汇总以及功能蛋白的细胞定位(Cellular component)分类汇总。
OrthoVenn2还直接提供便利的GO富集分析。GO富集分析会计算选定区域的基因与 GO分类中某个特定的分支的分布关系,并返回一个p-value,p-value越小,与基因组相关联的特定GO分类条目就越显著。通过对特定范围内基因进行GO富集分析,可以揭示物种特异性可能与哪些基因功能直接相关。
此外,OrthoVenn2还有一个可视化工具ClusterVenn,可以上传本地的聚类数据文件来生成韦恩图。
展览馆Gallery中展示了OrthoVenn2预先运行的一些经典示例,可以直接点开查看。
总的来说OrthoVenn2 的使用非常方便,不需要下载软件,网页页面十分友好,分析得出的图片也十分美观,分析功能相比之前的版本更加强大和丰富,可以让大家在比较基因组学分析过程中快速获取到自己需要的信息。OrthoVenn2的功能如此强大,赶快试试吧!
参考文献:Ling Xu, Zhaobin Dong, Lu Fang, Yongjiang Luo, Zhaoyuan Wei, HailongGuo, Guoqing Zhang, Yong Q Gu, Devin Coleman-Derr, Qingyou Xia, Yi Wang,OrthoVenn2: a web server for whole-genome comparison and annotation oforthologous clusters across multiple species, Nucleic Acids Research, Volume 47, Issue W1, 02 July 2019, Pages W52–W58, https://doi.org/10.1093/nar/gkz333