GO委员会工具
AmiGO [http://amigo.geneontology.org/cgi-bin/amigo/go.cgi]
AmiGO 提供检索和浏览GO委员会提供的本体学(ontology)和注释(annotation)数据。用户可以通过检索蛋白获得相应的GO术语,可以检索GO术语得到相应的细节和相关的蛋白注释,AmiGO还提供了BLAST搜索引擎,比对有GO术语注释的基因和基因产物的序列。
OBO-Edit [https://sourceforge.net/project/ ... up_id=36855&package_id=192411]
OBO-Edit是一个开源的、与平台无关的应用程序,用于显示和编辑OBO格式的本体文件.OBO-Edit是基于图的工具,强调本体的全部图结构,给生物学家提供了一个友好的接口。OBO-Edit是个很好的工具,关注于相对简单的门类的相互关系,有助于本体学的快速更新。
非GO委员会工具
用于搜索和浏览GO的工具:显示、浏览和搜索相应的本体和注释
** CGAP GO Browser [http://cgap.nci.nih.gov/Genes/GOBrowser]
提供浏览GO词汇,可以找人和小鼠基因对应的GO术语, 每隔几个月更新GO的数据。
** COBrA [http://www.xspan.org/cobra/]
一个基于Java的本体编辑器,区别于其它编辑器在于其提供了两个本体间概念上的连接,以及提供了精细的分析和验证功能。除了支持GO和OBO格式之外,COBrA还能导入和导出本体为语义web(Semantic Web)格式如RDF、RDFS、OWL。
** Comparative Toxicogenomics Database [http://ctd.mdibl.org/]
CTD是一个公用的数据库,加强了对环境中化学物质对人类健康的理解,整合了GO数据和GO浏览器。使得用户可以理解暴露在化学物质下相关靶标的生物功能、过程和细胞定位。
** DynGO [http://gauss.dbb.georgetown.edu/liblab/dyngo.html]
是一个客户端-服务器模式的应用程序,提供了许多高级的功能,除了标准的浏览功能外,DynGO允许用户批量地检索一系列基因和基因产物的GO注释,以及语义检索一系列基因和基因产物所共有的相似GO注释,结果根据GO的等级显示为树状结构,支持许多动态显示的选项如对树节点排序或改变树的方向。对于GO管理者和经常使用GO的用户,DynGO提供了快速和方便的访问GO注释数据。DynGO广泛地应用到有GO术语注释的任意数据集。
** EP GO Browser [http://ep.ebi.ac.uk/EP/GO/]
EP GO Browser是EBI的Expression Profiler中的一个组件(Expression Profiler是一个工具集,用于聚类、分析和可视化显示基因表达和其它基因组数据),通过它,你可以搜索GO术语和识别基因相关的节点,以及相应的子节点。
** Gene Class Expression [http://gdm.fmrp.usp.br/cgi-bin/gc/upload/upload.pl]
Gene Class Expression允许使用GO数据库对SAGE数据进行功能注释。这个工具对每一个SAGE标签在GO数据库里进行搜索,对选定的GO类别和选定的等级进行关联。这个系统对于映射SAGE数据到GO结构上提供了用户友好的数据导肮和可视化。还对SAGE标签在每一个GO类别里的百分比提供了图形可视化以及置信区间和假设检验。
** GeneInfoViz [http://genenet2.utmem.edu/geneinfoviz]
GeneInfoViz是一个基于web的工具,提供批量检索基因功能信息、可视化GO结构和构建基因相关网络。用户需要提供一个基因列表(格式可为LocusLink ID、UniGeneID、gene symbol、accession number),结果返回功能基因组信息。基于对给定基因的GO注释,GeneInfoViz允许用户以GO的DAG结构显示这些基因,以及在选定的DAG水平上构建基因相关网络。
** GeneOntology at RZPD [http://www.rzpd.de/cgi-bin/asearch/GO/go4rzpd.pl.cgi]
RZPD提供了GO标识符和相关联的UniGene ClusterIDs、Genes(Name/Symbol)、Clones的检索,目前GO注释关联了人和小鼠的基因/克隆。
** GenNav [http://mor.nlm.nih.gov/perl/gennav.pl]
检索GO术语和注释的基因产物,提供在GO DAG图中可视化显示GO术语。
?
** GOblet [http://goblet.molgen.mpg.de/]
GOblet服务器考虑了GO术语,执行序列(cDNA,蛋白)分析。如相似性搜索(BLAST),在使用已有的GO注释构建的不同物种的数据库的前提下,服务器展示了所有匹配的细节描述以及基于匹配到的GO术语构建GO概要树(summary tree)
** GoFish [http://llama.med.harvard.edu/Software.html]
GoFish是在线的java程序,也可以下载到本地运行。允许用户使用GO属性构建任意的布尔检索,对符合条件的基因产物进行排列,GoFish也对每一个基因产物估算其符合布尔查询的概率
** GONUTS [http://gowiki.tamu.edu/]
GONUTS是基于wiki的GO术语和少量物种基因关联的浏览器,wiki接口允许用户创建和分享每一个GO术语用法的注解。
** MGI GO Browser [http://www.informatics.jax.org/searches/GO_form.shtml]
通过MGI GO Browser可以搜索GO术语和显示所有小鼠基因注释到每一个术语或子术语。也可以浏览本体来观察术语之间的关系、术语定义、对于给定的术语和它的子术语所注释的小鼠基因数量。MGI GO Browser直接访问MGI数据库中的GO数据(每晚更新)。
** Ontology Lookup Service [http://www.ebi.ac.uk/ontology-lookup/]
OLS整合了公开的可用生物医学本体到单一的数据库。所有修正的本体是每天更新的。一个当前加载的本体列表可以在线获得,这个数据库能够通过检索获得单一术语的信息或使用AJAX浏览完整的本体。自动补齐提供一个用户友好的搜索机制。一个基于AJAX的本体显示器可以有效地浏览完整的本体或其子集。一个可编程接口可以通用使用SOAP来检索网络服务。服务由一个WSDL描述器描述,此文件可在线获得。一个简单的java客户端使用SOAP来连接网络服务,可以从SourceForge上下载到。所有的OLS源代码是公开的,使用Apache许可证发布。OLS提供了一个用户友好的单一入口指向公开可获得的本体(Open Biomedical Ontology格式)。
** PANDORA [http://www.pandora.cs.huji.ac.il/]
使用PANDORA可以搜索蛋白的任何非一致集(non-uniform sets)和检测共享独特生物属性的蛋白子集,以及这些集合的交集。PANDORA支持GO注释和额外的关键字(来自于UniProt Knowledgebase, InterPro, ENZYME,SCOP等等)。PANDORA被整合进ProtoNet system,从而允许测试上以万计的自动产生的蛋白家庭。PANDORA已经取代了由同一个团队开发的ProtoGO浏览器。
** QuickGO at EBI [http://www.ebi.ac.uk/ego/]
QuickGO是一个GO浏览器,由EBI开发,是InterPro的一个组件,可以搜索GO术语来观察它的相关节点和定义,还可以映射到SWISS-PROT关键词、酶分类,转运分类数据库或者InterPro入口。GO数据每日更新。
** TAIR Keyword Browser [http://www.arabidopsis.org/servl ... =new_search&type=keyword]
搜索和浏览GO、TAIR解剖(Anatomy)、TAIR发育阶段术语(developmental stage terms),允许显示术语的细节及其相关的术语。包括基因、文献、芯片实验和相应术语的或子术语的注释之间的关联。
** Tk-GO
这个工具是对BDGP的GO::AppHandle库基本功能的一个GUI包装。GO术语在一个explorer-like浏览器里展示,程序可以通过修改perl脚本来配置。Tk-GO使用的GO数据库(默认直接连接BDGP的数据库)是用户可以修改的。
注释工具:使用GO对基因和基因产物注释的工具
** g rofiler [http://biit.cs.ut.ee/gprofiler]
g rofiler是一个公用的web服务器,用于挖掘高通量基因组数据。g rofiler有一个简单、用户友好的网页接口,对于获取GO、通路或转录结合因子在单个基因水平上的富集等具有强大的可视化功能。除了标准的多重检验校正(multiple testing corrections)外,引进了一个对复杂结构(如GO)进行多重检验的真实效果估算的改良方法。解释基因列表通过一个高效的算法由同一接口支持。其它实用的数据分析通过模块支持。整合进g rofiler的模块有:g:Convert转换不同数据库的ID,g:Orth找寻不同物种的直向同源基因(orthologous genes),g:Sorter搜索绝大部分的公用基因表达数据找寻共表达的数据。g rofiler支持31个不同的物种,数据定期从数据源(如Ensembl数据库)更新。生物信息学社区希望g rofiler能支持简单的文本输出。
?
** GeneTools [http://www.genetools.microarray.ntnu.no/common/intro.php]
GeneTools收集了许多基于web的工具,从许多不同的资源里收集信息,提供可用的基因组分析,两个主要的工具连接到这一数据库是NMC注释数据库V2.0和eGOn V2.0。NMC注释数据库V2.0提供了来自于UniGene、EntrezGene、SwissProt和GO的信息。
** GOanna [http://agbase.msstate.edu/GOAnna.html]
使用相似性搜索来找寻蛋白的注释,输入可以是一系列的ID或是一系列FASTA格式的序列。如有需要GOanna会检索序列,并对用户指定的数据库进行BLAST搜索。结果包含BLAST搜索到的相似性高的序列的GO注释和序列比对的结果。
** GoAnnotator [http://xldb.fc.ul.pt/rebil/tools/goa/]
此工具对从文献里提取的蛋白GO术语注释进行验证。
** GOCat:Gene Ontology Categorizer? [http://eagl.unige.ch/GOCat/]
GOCat是一个自动的文本分类器,此工具归类任意的输入文本(几个词,一篇摘要,一系列的PubMed识别符等等)到GO分类。这个系统目标在于通过文本挖掘方法方便对基因和基因产物进行功能注释。对于每一个的预测类别,提供一个置信打分和一段抽取于输入文本的简短文本。
** GoFigure [http://udgenome.ags.udel.edu/gofigure/]
对未知的检索序列通过BLAST来识别其同源的注释,以此来预测其GO注释。DNA或蛋白质序列都允许提交,多重的检索可以通过提交包含FASTA格式的文件来完成。检索到的结果通过email返回给用户,结果显示为图或者是tab分割的文件。结果可以通过tar打包文件下载。
** GoPubMed [http://gopubmed.org/]
GoPubMed是一个网络服务器,允许用户结合GO探索PubMed搜索结果,GoPubMed提交用户的关键字到PubMed,检索摘要,检测摘要中的GO术语,显示与最初检索结果相关的GO子集,允许用户通过语义浏览和显示相应的文献和它们的GO注释。
** GOtcha [http://www.compbio.dundee.ac.uk/Software/GOtcha/gotcha.html]
GOtcha提供了对于给定的检索序列相关GO术语的预测。每一个术语相对于引用搜索是分数独立(scored independently)和分数校准(scores calibrated)的,以便给出正确性的准确百分比可能性(to give an accurate percentage likelihood of correctness)。
** HT-GO-FAT:High Throughput Gene Ontology Functional Annotation Toolkit [http://liru.ars.usda.gov/ht-go-fat.htm]
HT-GO-FAT允许高通量映射未知或其它基因序列如ESTs、mRNA、蛋白数据到GO注释、EC numbers、KEGG通路。它使用序列相似性和结构域匹配。此工具使用自定义的校正数据库以及拥有诸如窗口局域网分布式BLAST(windows LAN distributed BLAST),能够通过窗口局域网分布高通量的BLAST搜索。HT-GO-FAT还拥有高通量的BLAST输出观察器,以及能对匹配度高或人工校正的数据导出为许多的文件格式。数据能导出为AmiGO相关的文件,通路图会高亮显示用户数据集中的酶/基因。
???
** InGOt (商业软件) [http://www.inpharmatica.co.uk/ingot/]
InGOt是Inpharmatica的新模块系统中的一个模块。这个系统用于蛋白注释,是一个应用GO到所有蛋白的一个商业系统。它提供一个无与伦比的资源来阐释蛋白功能:它的图形用户界面让你轻松地从各个链接中跳转,从汇总数据到分层语境(hierachical context)和文献/证据(literature/evidence)。InGOt拥有比公开资源更为丰富的序列和最广泛的GO关联资源。InGOt可以和其它模块整合,如Domain Professor用于蛋白结构域的细节注释和Blu-Chip用于即时和准确的探测蛋白赋值(protein assignments)。
** InterProScan [http://www.ebi.ac.uk/InterProScan/]
蛋白结构域和功能位点数据库对于蛋白功能的预测是一个关键的资源。十年来,许多标识识别(signature-recognition)方法逐步形成来解决不同序列分析问题。产生不同和独立的数据库。由于强调不同的分析方法,这些资源有着各自不同的优点和缺点,各自有着不同的最优应用。从而,为了得到最好的结果,搜索策略必须完美地结合所有的资源。InterProScan是一个基于Perl的程序,它能够结合不同的蛋白标识识别方法到一个资源上。
** JAFA:Joint Assembly of Functional Annotations [http://jafa.burnham.org/]
JAFA接收蛋白序列,提交它到数个功能预测程序,并将预测结果聚集到一个单一的、易读的、基于GO术语的文件,用户可以点击各个服务器、AmiGO和QuickGO。JAFA还提供包含所有结果的XML文件下载。
** Manatee [http://manatee.sourceforge.net/]
Manatee是基于web的基因评估和基因组注释工具,Manatee能够存储和显示原核和真核基因组注释。Manatee界面允许生物学家快速识别基因以及对其进行高质量的功能赋值(诸如GO分类,使用搜索数据,paralogous家族和由自动分析所产生的注释),Manatee能够下载和安装,运行于CGI网络服务器,比如Apache。
** PubSearch [http://pubsearch.org/]
PubSearch是基于web的文本管理工具,允许管理者搜索和注释基因到文献的关键字。它的后端有一个简单的mySQL数据库,PubSearch使用一系列Java伺服小程式和JSPs来完成检索、修改、增加基因、基因注释和文献信息。此工具可以从GMOD上下载到。
用于基因表达/芯片分析的工具
** Avadis - gene expression analysis with GO browser (商业软件) [http://avadis.strandgenomics.com/]
Avadis是基因表达数据的数据分析和可视化工具,内置一个显示GO等层的浏览器,许多基因有共同的本体途径(common ontology paths),对基因表达聚类可以通过GO语义进行聚类以识别功能标识(functional signatures)
** BiNGO [http://www.psb.ugent.be/cbd/papers/BiNGO/]
开源的java工具,在一个基因集合里确定那个GO类别是统计上过表达(over-represented)的。BinGO以Cytoscape的插件实现,Cytoscape是分子相互作用网络数据整合和可视化的软件平台。BinGO映射给定基因集的主要功能主题到GO等级上,并输出这一映射为Cytoscape图。
** CLENCH:CLuster ENriCHment [http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/]
CLENCH允许拟南芥(A. Thaliana)研究者从TAIR上执行自动的GO注释检索并计算给定的基因集(相对于参考集)的GO术语富集。在计算富集之前,CLENCH允许把返回的注释映射到GO slim术语表(能够被用户编辑)和本地安装的GO上的任何粗糙水平,
** DAVID atabase for Annotation, Visualization and Integrated Discovery [http://david.abcc.ncifcrf.gov/]
基于web的工具,提供由高通量技术产生的基因组水平数据集(诸如表达谱和蛋白组平台)的注释和分析的整合解决方案。分析结果和图形显示保留动态链接到主要的数据库和外部数据仓库,从深度和广度上覆盖数据。DAVID为数据收集到生物意义的转变提供便利,加速了基因组水平数据的分析。
** EASE [http://david.niaid.nih.gov/david/ease.htm]
EASE对于一个给定的基因列表概述主要的生物学主题。给定的基因列表来自于表达谱或其它的基因组水平实验,EASE能够快速计算相对于数据集里所有基因每一个统计上可能的过表达GO术语。
** eGOn v2.0:explore Gene Ontology [http://www.genetools.no/]
基于web的工具,映射表达谱数据到GO结构上。多个的输入文件能够同时分析以比较两个或多个实验的注释基因的分布。
eGOn V2.0的核心特性:
.可视化:基因注释以GO DAG可视化显示或以表格的形式显示,GO DAG的尺寸能够由用户自由定义。
.过滤:GO注释能够基于evidence codes进行过滤。
.包含用户定义的GO注释:事先加入到NMC注释数据库中。
.统计分析:多个基因列表能够同时分析以比较GO等级上注释基因的分布,统计测验设计成允许用户在两个基因列表之内或之间计算GO注释的不同(dissimilarities)。
.连接注释数据库:连接到NMC注释数据库,基因和蛋白的信息直接由GO DAG或导出的数据提供。
.导出:GO DAG信息、统计结果、基因和蛋白信息能够导出为Excel、text、XML格式。
** ermineJ [http://bioinformatics.ubc.ca/ermineJ]
分析表达数据中的基因集(用户定义或通过GO术语定义)的工具。这个软件设计为给只有很少或没有信息学背景的生物学家使用。为想使用ermineJ脚本的用户提供一个命令行接口。实现了多个不同的对基因集的打分方法,不是简单地集中于依赖过分表达(over-representaion)方法上。
** FatiGO [http://www.fatigo.org/]
FatiGO对给定的基因集,以代表性的功能信息(低表达或过表达GO术语)对其赋值。通过多重检验纠正(multiple-testing correction)得到统计显著性。FatiGO被设计成在DNA芯片数据分析的上下文里进行功能注释,FatiGO链接到基因表达模式分析套件(Gene Expression Pattern Analysis Suite)里。FatiGO使用主要的基因组和蛋白组数据库(GeneBank, UniProt, Unigene, Ensembl,etc)的基因IDs。FatiGO适用于任何类型的大规模实验进行功能注释。
** FIVA:Functional Information Viewer and Analyzer [http://bioinformatics.biol.rug.nl/standalone/fiva/]
FIVA协助原核生物社区的研究者进行转录组分析时快速识别相关生物过程。此软件分析大量基因的功能谱并对影响的生物过程产生一个综合的概述
** FuncAssociate [http://llama.med.harvard.edu/cgi/func/funcassociate]
FuncAssociate是一个基于web的工具,接受一个基因列表作为输入,并返回输入列表中过表达或低表达(over- or under-represented)的GO属性。经过多重假设检验后只有那些统计上具有显著性的过表达或低表达的属性才会被报道。目前有10个物种被支持。除了输入基因列表外,用户还可以指定a)这一列表是否被认为是排序还是乱序的。b)FuncAssociate所认为的总基因(the universe of genes)。c)单独报道过表达或低表达的属性,还是两者都报道。d)p-value cutoff值。
新版的FuncAssociate(还处于测试阶段)支持更广泛的基因命名方案,并使用更为频繁更新的GO相关文件(GO associations),然而原来版本的一些特性诸如按LOD排序或查看基因属性表格的选项还没有实现。
** FuncExpression [http://www.barleybase.org/funcexpression.php]
FuncExpression是一个基于web的资源,对大规模的基因组数据进行功能解析。FuncExpression能对植物、动物和真菌的基因列表(从基因组和蛋白组实验中产生)进行功能比较。多个的基因列表能够被分类、比较和可视化显示。FuncExpression支持双通道整合(two way-integration)植物功能信息和基因表达数据,这使得后续的交叉验证(cross-validation)成为可能,交叉验证使用BarleyBase相关实验获得的植物芯片数据。
** FunCluster:FunCluster, Functinal Profiling of Microarray Expression Data [http://corneliu.henegar.info/FunCluster.htm]
FunCluster是一个基因组数据分析工具,设计成对cDNA芯片实验产生的基因表达数据进行功能分析。除了自动对基因表达数据进行功能注释外,FunCluster通过特定设计的共棸类对涉及到的生物注释和基因表达数据进行功能分析,能够检测出共调控的生物过程(注释基因组主题所展示)。FuncCluster的功能分析依赖于GO和KEGG注释,并且只支持三个物种:人(Homo sapiens)、小鼠(Mus musculu)和酿酒酵母(Saccharomyces cerevisiae)。
** FunNet:Functional Analysis of Transcriptional Networks [http://www.funnet.info/]
FunNet设计为一个分析基因共表达网络(由芯片表达数据所构建)的整合工具,此工具的分析模块的实现涉及到两个抽像层:转录(如基因表达谱)和功能(如转录分析所显现的生物学主题)。依赖于GO和KEGG注释的功能分析技术,应用于从基因芯片表达数据中抽提一系列相关生物学主题。多重情况表达(multiple-instance representations)用来关联注释转录本和相关的生物学主题。一个原创(original)的非线性动态模型被用来量化相关基因组主题(genomic themes)上下文的接近度,这一量化基于在基因共表达网络(如在注释主题中捕获转录本的相似的表达谱)中基因组主题的增殖模型(patterns of propagation)。最后,一个非监督的多重情况光谱聚类过程(an unsupervised multiple-instance spectral clustering procedure)被用来探索共表达网络的模块结构,这是通过聚集共表达网络所显示出来的显著性相互关系的生物主题来实现的。提供了共表达网络的功能、转录表达、相关的转录和基因组主题的上下文详细信息。
FunNet提供了基于web的工具以及作为一个标准的R包。标准R实现能够运行在任何能运行R环境的操作系统(windows, Mac OS, 各种Linxu和Unix)上,能够从FunNet网站或者从CRAN的镜像站上下载到。两种实现的FunNet都是使用GPL2.0发布的。
** G-SESAME [http://bioinformatics.clemson.edu/G-SESAME/]
G-SESAME包含了一系列工具,分别是:
1.衡量GO术语语义相似性的工具。
2.衡量基因功能相似性的工具。
3.基于GO术语注释信息聚类基因的工具。
** GARBAN [http://www.garban.org/garban/home.php]
GARBAN是对cDNA芯片和蛋白质组技术产生的数据进行分析和快速功能注释的工具,GARBAN实现为生物信息学工具,以快速比较、分类和图形展示各种数据集(genes/ESTs或proteins),目的在于为病理和药学研究中识别分子标记(molecular markers)提供便利。GARBAN链接到主要的基因组和蛋白质组数据库(Ensembl, GeneBank, UniProt Knowledgebase, InterPro,etc.)并遵循GO委员会的标准进行语义分类。代码是共享的: e-mail [email protected]
** GENECODIS [http://genecodis.dacya.ucm.es/]
GENECODIS是一个基于web的对基因列表进行功能分析的工具,它整合了不同的信息资源来搜索最频繁的共存在基因集的注释,并通过统计显著性排列它们。注释分析来自于不同的数据库如GO,KEGG或SwissProt。
** GeneMerge [http://www.oeb.harvard.edu/hartl ... erge/GeneMerge.html]
GeneMerge对于一个给定的基因集返回功能基因组信息,并提供此基因集里过表达的特定功能或分类的统计秩值(statistical rank scores)。展示了所有的GO类别和功能基因组数据。
** GFINDer: Genome Function INtegrated Discoverer [http://www.medinfopoli.polimi.it/GFINDer/]
GFINDer是一个多重数据库系统(multi-database system)提供了大规模的用户分类的序列标识列表和基因组生物学信息以及列表中不同基因类别的特征生物学功能谱。GFINDer自动从不同的资源检索更新功能分类的注释信息,识别用户分类的基因列表中每个分类的富集类别。并计算每一个类别的统计显著性。而且,GFINDer能够根据挖掘的功能类别对基因进行功能分类并且对这些分类进行统计分析,使得能够更好地解释芯片实验结果。
** GOALIE: Generalized Ontological Algorithmic Logical Invariants Extractor [http://bioinformatics.nyu.edu/Projects/GOALIE/]
GOALIE是用来构建时间序列依赖富集的工具,需要ODBC连接到GO数据库。
** GOArray [http://ycmi.med.yale.edu/gomine]
GOArray是一个Perl程序,输入一系列基因注释为“感兴趣(of interest)”(GOI)或者不感兴趣,并确定相关的GO术语对于GOI是否过表达。一个置换检验(permutation test)是可选的,用来评估结果的可靠性。输出包括了多个可视化图和补充信息以及进一步的参考,还有对所使用的统计方法的概述。
** GOdist [http://basalganglia.huji.ac.il/links.htm]
GOdist是一个Matlab程序,用于分析Affymetrix芯片表达数据,实现了Kolmogorov-Smirnov(KS)连续统计方法。还引入一个两侧超几何分布(two-tailed hypergeometric distribution)使用Fisher exact检验实现了离散方法。GOdist能够检测出芯片基因相关的GO术语相对于不同总体的差别,总体可是是全局芯片总体、分析的GO术语的直接父节点或全局父节点。
** GOHyperGAll [http://faculty.ucr.edu/~tgirke/D ... oCondManual.html#go]
检验样本总体基因得到过表达的GO术语,R/BioC函数GOHyperGAll对所有的GO节点进行超几何分布检验计算并返回相应的P值,后续的过滤函数使用默认的或自定义的GO Slim类别执行GO Slim分析,使用此工具必须有基本的R和BioConductor知识。
** GoMiner and MatchMiner [http://discover.nci.nih.gov/gominer/htgm.jsp]
High-Throughput GoMiner是一个工业级别的整合GO工具,用于解析多芯片实验。GOMiner是基于Java的程序包,对感兴趣的基因(如芯片实验里上调或下调基因)在GO的上下文里进行生物学解析。GoMiner提供定量和统计的输出文件和两个有用的可视化文件:(i)树状结构类似于AmiGO浏览器里所显示的(ii)一个压缩的,动态交互的DAG。GoMiner所展示的基因链接到主要的公开生物信息学资源。一个陪伴工具(companion)MatchMiner用于做前处理,为GoMiner或其它的GO工具的输入获取基因名称,提供了一个自动化脚本以便于安装本地化的数据库。
** GOstat [http://gostat.wehi.edu.au/]
GOstat是一个易于使用的web工具,用于确定基因列表中过表达或低表达的GO类别的统计显著性。数据每月更新。
** GoSurfer [http://biosun1.harvard.edu/complab/gosurfer/]
GoSurfer在分析基因集(来自于基因组范围的计算、芯片分析或其它相应的高端方法)时使用GO信息,GoSurfer包含了严格的统计检验,交互的图形和自动更新注释信息(基因标识符(UniGene,LocusLink)或Affymetrix探针集)。
** GO Term Finder [http://search.cpan.org/dist/GO-TermFinder/]
GO Term Finder对给定基因列表的基因产物的GO术语或其父节点作显著性的分析。Saccharomyces Genome Database 实现了一个基于web的GO Term Finder用于为出芽酵母基因产物搜索注释。一个通用的GO Term Finder由Standford Microarray Database创建,可以从CPAN下载到。这个代码被普林斯顿基因组研究组(Princeton genomics group)用于创建基于web的通用GO Term Finder,通过该web工具提供了分析GO站点上所公开的有GO注释的任何种属(包括人)的基因。
** GOTM:Gene Ontology Tree Machine [http://bioinfo.vanderbilt.edu/gotm/]
GOTM是一个基于web的工具,基于GO等级结构分析和显示感兴趣的基因集。这个工具提供了用户友好的数据导航和可视化。产生可扩展的树用于浏览GO等级结构,以HTML的形式生成固定的树用于对不同注释水平进行归档并生成柱状图,GOTM提供统计分析以显示GO类别和相对富集的基因数目以及暗示(suggest)了进一步研究的生物领域。富集的GO类别能够以子树或DAGs的形式展示。基因的子集能够检索GO术语或进行关键字搜索。每一个基因的细节信息能够直接从GeneKeyDB里检索到。
** GOToolBox [http://gin.univ-mrs.fr/GOToolBox/]
GOToolBox是一系列基于web的程序,允许从一个基因集(相对于被检索的参考基因集)识别统计上过表达或低表达的术语、基因集里对功能相关的基因进行聚类和检索基因集里共享的注释。GO注释能够限制在GO slim等级上或者是给定的GO术语水平上,而且术语可以使用evidence codes进行过滤。GO和基因关联文件每月更新。
** L2L [http://depts.washington.edu/l2l/]
L2L是一个简单但功能强大的工具,用于发现芯片数据中隐藏的生物学显著性,通过易于使用的web界面,L2L挖掘GO术语显著富集的上调或下调的基因,L2L还将基因列表与数据库中上以千计的芯片实验作比较,以识别共有的基因调控模式。此工具可以下载到一个命令行的版本,可以自定义运行或者批量分析。
** Machaon Clustering and Validation Environment [https://www.cs.tcd.ie/Nadia.Bolshakova/Machaon.html]
Machaon Clustering and Validation Environment是一个聚类验证的工具,将样本或基因按相似的基因表达模式进行分类并评估聚类的质量。在基因表达数据分析中GO术语用于衡量基因间的相似性(生物学距离)以支持生物医学知识发现(biomedical knowledge discovery)。
** MAPPFinder [http://www.genmapp.org/MAPPFinder.html]
MAPPFinder是GenMAPP的辅助程序。这个程序允许用户检索任何存在的,相对于GO基因相关和GenMAPP芯片通路谱(MAPPs, microarray pathway profiles)的表达谱数据标准。分析产生的结果能够通过选择感兴趣的术语或MAPPs直接以GO等级或在GenMAPP中展示出来。
** Onto-Compare [http://vortex.cs.wayne.edu/projects.htm#Onto-Compare]
Onto-Compare是一个基于web的工具,可以基于GO对商业芯片进行比较。Onto-Compare允许用户对每一个芯片做功能偏好性评估并确定对于某个特定生物学现象(由GO术语描述)最好的芯片。
** Onto-Design [http://vortex.cs.wayne.edu/projects.htm#Onto-Design]
Onto-Design允许用户设计定制芯片,通过选择一系列UniGene cluster IDs,这些IDs代表了一个给定的生物过程子集(使用GO术语描述)。
** Onto-Express [http://vortex.cs.wayne.edu/projects.htm#Onto-Express]
Onto-Express搜索公共数据库并返回一系列表格,包换相关表达谱、基因细胞发生定位(cytogenetic gene locations)、生物医学和分子功能、生物过程、细胞组分和翻译的蛋白的细胞功能。
** Onto-Miner [http://vortex.cs.wayne.edu/projects.htm#Onto-Miner]
Onto-Miner允许用户通过clone ID, UniGene gene symbol, LocusLink ID, accession number等搜索不同的公开生物信息学数据库,允许使用基因列表进行批量检索。第三方开发者可以把这个站点作为资源,提供对于任意的基因列表的详细基因信息。
?? * Onto-Translate [http://vortex.cs.wayne.edu/projects.htm#Onto-Translate]
Onto-Translate是基于web的工具,允许用户对下列ID进行快速转换:accessions IDs, Unigene cluster IDs 和Affymetrix probe IDs。Onto-Translate使用不同的数据库并降低任意基因列表的冗余,帮助识别相同的信息。
** OntoGate [http://functionalgenomics.de/ontogate/]
OntoGate提供使用GO术语和与GO术语相关的外部数据库进入GenomeMatrix(GM)的入口,以找寻GM中不同物种的基因,这些基因能到映射到GO术语上。OntoGate包含了对相应注释基因的氨基酸序列进行BLAST搜索。
** Ontologizer [http://www.charite.de/ch/medgen/ontologizer/]
Ontologizer能够对一组或多组基因或基因产物产生相应 的GO注释,并根据每一个聚类的使用频率进行排列,以HTML或XML格式显示。如果提供了总体的数据集,程序会对每一个GO术语执行过表达的统计分析。产生“Dot"(GraphViz)文件对过表达的GO术语提供图形化概述。提供了每一个基因的详细列表。
** Ontology Traverser [http://franklin.imgen.bcm.tmc.ed ... e=OntologyTraverser]
Ontology Traverser是芯片基因列表富集工具,此工具为一些cDNA芯片和相对于芯片类型所使用的所有探针/克隆集列表提供了简单的上传格式,接收AffyIDs和NIAIDs。支持许多报告格式:flat html,flat tsv, xml和展示GO结构的动态可点击HTML。对每一个GO节点报告不同的统计/结果:列表fq, 芯片fq, fold change,? Fisher's exact test P值和基因的映射到的节点或子节点的标识。
** Probe Explorer [http://probeexplorer.cicancer.org/]
Probe Explorer是一个开放使用的基于web的生物信息学程序,显示芯片寡核苷酸探针和在基因组上下文中的转录本的关联,此软件很灵活,可以简单地作为基因组和转录组的浏览器。提供了15种后生动物(metazoa)和两种酵母提供基因组实体(genomic entities)(位点, 外显子, 转录本)的序列和对等物包括矢量图输出。序列比对工具用来建立Affymetrix芯片探针序列和转录组(人,小鼠,大鼠和酵母)之间的关联。提供使用任何的DNA或蛋白序列进行关键字搜索、用户搜索和在基因组上进行比对。
** ProfCom: ProfCom, Profiling of Complex Functionality [http://webclu.bio.wzw.tum.de/profcom/]
ProfCom是基于web的工具,用于对实验相关的基因列表进行功能解释。使得ProfCom成为独特工具的一个特征是除了GO术语外还可以使用复杂函数(complex function)进行富集分析。复杂函数由可用的GO术语的布尔组合构建。ProfCom对复杂函数作推断能够更加特异地比较单个的术语并更为准确地描述基因的功能。
** SeqExpress [http://www.seqexpress.com/]
SeqExpress是一个综合的分析和可视化软件包,用于基因表达实验。组合了特定开发的技术和通用的统计学方法,GO被用来对聚类的功能富集进行打分。这些结果能够在内嵌的浏览工具或通过通过网页进行浏览。SeqExpress还支持许多数据转换,投影(projection),可视化显示,文件输入/输出,搜索,与R整合,和聚类等选项。
** SerbGO [http://estbioinfo.stat.ub.es/apli/serbgo/]
SerbGO是基于web的工具,帮助研究者确定那一个基因芯片分析工具、GO语义分析工具适合他们的项目。SerbGO是一个双向(bidirectional)程序。用户能通过检索表单索要感兴趣的工具的特性,用户还能比较每一个工具所实现的特性。
** SOURCE [http://source.stanford.edu/]
SOURCE编辑来自多个公开访问的数据库(包括UniGene, dbEST, UniProt Knowledgebase, GeneMap99, RHdb, GeneCards和LocusLink)的信息,SOURCE使用的GO术语与LocusLink相关。
** Spotfire Gene Ontology Advantage Application (商业软件) [http://www.spotfire.com/services/advantage.asp]
Spotfire Gene Ontology Advantage Application整合GO注释和基因表达分析。研究者在DecisionSite里可视化地选择一个子集的基因,软件展示了基因的GO等级分布。类似地,在GO等级里选择任何的过程、功能或细胞定位可以在DecisionSite里可视化地显示其相应的基因。
** STEM: Short Time-series Expression Miner [http://www.cs.cmu.edu/~jernst/stem/]
STEM是一个Java程序,用于聚类、比较和可视化短时间序列的基因表达数据(少于或等于8个时间点)。STEM允许研究者识别显著性的时间表达谱和与这些表达谱相关的基因,并比较不同条件下这些基因的行为。STEM完整地整合了GO数据库,并支持对具有相同的时间表达谱的基因集做GO类别富集分析。STEM还支持对特定GO类别的基因行为进行简易的识别和可视化,识别在这些基因中那些时间表达谱被富集。
** T-Profiler [http://www.t-profiler.org/]
T-Profiler使用t检验对预定义的基因集的平均活性改变进行打分。基因集分别基于GO类别、ChIP-chip实验、上游与相应的转录因子结合模体匹配、在相同染色体上的定位进行定义。一个大折刀(jack-knife)过程使得计算比其它软件要更为稳健。T-Profiler使得对芯片数据进行解析以直观和严格统计成为可能,而不需要结合实验或者选择参数。
** THEA:Tools for High-throughput Experiments Analysis [http://thea.unice.fr/index-en.html]
THEA是一个整合的信息处理系统,用于分析后基因组数据。可以自动化进行数据(由通过选择的生物学信息包括GO进行分类)注释。用户可以对这些注释手动搜索和浏览,或根据统计标准(数据挖掘)产生有意义的概述。
其它工具
** APID:Agile Protein Interaction Data Analyzer? [http://bioinfow.dep.usal.es/apid/index.htm]
APID是一个交互的生物信息学web工具,在一个统一的和比较性的主要平台,用于整合和分析,目前已知的信息是由特定的小规模或大规模的实验方法所展示的蛋白质相互作用。目前,此应用程序包含来自于5个主要数据库资源的信息,装入于单一服务器以探索4万个不同蛋白和接近于15万已证实的不同相互作用。网站包含搜索工具以检索和浏览数据,允许通过计算的参数选择相互作用对,这些参数衡量每一个特定的蛋白相互作用的可靠性。蛋白的参数是连通性、聚类系数、GO功能环境、GO环境富集;相互作用方式的数目、GO重叠(GO overlapping)、iPfam结构域-结构域相互作用。APID同样包含了一个图形互动的工具用来显示选择的子网或者整个网络以及对其导航。
** Blast2GO [http://www.blast2go.de/]
B2G基于GO注释和功能分析进行相似性搜索。B2G对基因功能信息可能性提供直接的统计分析并在GO有向非循环图中高亮显示相应的功能特性。而且B2G包含了不同的统计图表概述了包括BLASTing、GO映射、注释和富集分析(Fisher's Exact Test)。所有的分析过程是可配置的以及支持在任何分析阶段进行数据的输入和输出。这一程序同样接受已存在的BLAST或注释文件并将它们加入到后续的分析中。这个工具还提供了非常合适的平台来进行非模式生物的高通量功能基因组研究。B2G是一个不依赖于物种、直观和互动的桌面程序,允许监示和理解整个注释和分析过程,分析过程支持附加的特性如GO Slim整合,考虑evidence code(EC),批量模式或GO多水平饼图。
** Db for Dummies! [http://www.dbfordummies.com/go.asp]
DBD是一个小数据库,导入GO Slim,它允许数据以树的形式显示。
** Flash GViewer [http://www.gmod.org/flashgviewer/]
Fash GViewer是一定制的Flash电影能够轻易地被嵌入到网页以显示染色体上单独特性的位点。它试图提供特定特征集(如基因相关的特定GO术语等)的基因组位点的概述,而不是显示基因组的特性。特性能超链接到外部的网页以获得细节信息,使得GView能够作为一个导航工具。提供了大鼠、小鼠、人和线虫的基因组图谱(其它的基因组图谱也能够创建)。注释数据以静态的文本文件提供或者通过服务器端的脚本产生XML文件。
这个工具不是GO特异的,但是设计成可以显示GO注释数据。
** FunSpec [http://funspec.med.utoronto.ca/]
FunSpec是一个基于web的工具,对基因和蛋白集(如共调控基因、蛋白复合体、基因相互作用)基于已存在的注释包括GO术语进行统计评估。
** FuSSiMeG:Functional Semantic Similarity Measure between Gene Products [http://xldb.di.fc.ul.pt/rebil/ssm/]
能够通过比较基因注释中GO术语间的语义相似性来衡量基因产物间的功能相似性。还可以对任意GO术语进行语义相似性评估。
** Generic GO Term Mapper [http://go.princeton.edu/cgi-bin/GOTermMapper]
Generic GO Term Mapper映射基因列表中的粒状GO注释(granular GO annotations)到更为广泛、更高水平的GO父节点术语(有时候索引到GO Slim术语上),允许把基因归到更大的类别里。
** Genes2Diseases [http://www.bork.embl-heidelberg.de/g2d/]
Gene2Disease是一个映射到人类遗传疾病的候选基因的数据库。通过使用分析相关的表型特征和生化实体(chemical objects)、从生化实体到GO蛋白功能术语以及基于MEDLINE和RefSeq数据库产生了本数据库。能够用来显示特定遗传疾病相关的所有GO术语。
** GO Slim Mapper [http://db.yeastgenome.org/cgi-bin/GO/goTermMapper]
GO Slim Mapper用来注释出芽酵母基因产物,使用SGD GO Slim集,映射特定的粒状GO术语(granular GO terms)到相应的更为通用的GO slim父节点术语上。
** GO Terms Classification Counter [http://www.animalgenome.org/bioinfo/tools/countgo/]
GO Terms Classification Counter以一个包含GO术语IDs的格式化或非格式化文本文件作为输入,用户选择以下可供选择的类别如GO_slim、GOA、EGAD、MGI_GO_slim或GO-ROOT,程序执行计数,并返回结果于网页上(如果时间长的话,程序会给用户发送含有结果的链接)。结果包含了计数表格、百分比和一个饼图。
** GOBU:Gene Ontology Browsing Utility [http://gobu.iis.sinica.edu.tw/]
GOBU是一个基于Java的程序,使用GO和用户定义的等级两大目录(catalogs)在一个可扩展的体系下整合生物学注释目录(biological annotation catalogs)。GOBU拥有以下的特性 1)用户特定的等级数据作为输入数据,(2)用户定义描述不同注释的数据类型,(3)一个处理用户定义的数据类型的可扩展软件体系。
** GOChase [http://www.snubi.org/software/GOChase/]
GOChase是一系列基于web的工具,用于检测和纠正基于GO注释的错误。
.GOChase-History解决所有GO IDs修改的历史。
.GOChase-Correct高亮显示整合的GO IDs和重定向到正确主术语并进一步到整合的二级ID。对于过时的GO术语,GOChase推荐使用最短距离的非丢弃父术语。这个功能被用于GO浏览器如AmiGO和QuickGO以修复失效的超链接。
.完整的数据库(如LocusLink)可以作为平文件载入到GOChase里,报导注释错误和GOChase的纠正。
.当给一个GO ID输入时,GOChase会给出所有主要数据库里被这一GO ID所注释的所有基因产物。
** GOProfiler [http://agbase.msstate.edu/GOProfiler.html]
GOProfiler对AgBase中可用的GO注释提供一个概述。用户提供一个物种(分类学id),GOProfiler显示此物种GO相关的数目和蛋白注释的数目。结果以evidence code列出,并提供了一个未被注释的蛋白列表。
** GORetriever [http://agbase.msstate.edu/GORetriever.html]
用户提供一个蛋白ID列表,GORetriever在AgBase里搜索相应的GO注释,目前支持的ID类型是Uniprot ID、Uniprot Accession、GO ID。GORetriever产生蛋白和相应注释的列表以及一个没有GO注释的入口列表(list of entries)。没有GO注释的列表可以作为Goanna工具的输入以寻找相似序列(如果有注释的话会提供)。
** GOSlimViewer [http://agbase.msstate.edu/GOSlimViewer.html]
GOSlimViewer对一个数据集提供高水平的GO类别概述。它设计成使用GORetriever的输出。你可以为GORetriever文件添加附加的注释(来自于GOanna或其它的资源).GOSlim Viewer目前只支持GOSlim集。
** ProteInOn [http://xldb.fc.ul.pt/biotools/proteinon/]
ProteInOn能够找寻相互作用的蛋白、找寻相应的GO术语并计算蛋白相似的功能语义并获取信息内容和计算每个GO术语的功能语义相似性。
** TXTGate [http://www.esat.kuleuven.ac.be/txtgate]
TXTGate基于web-service,结合选择的公开生物学资源的文献索引到一个灵活的文本挖掘系统以分析不同的基因集。通过裁剪词汇表(tailored vacabularies)、选择文本文件、LocusLink的MedLine摘要和索引SGD。子聚类(subcluster)和到各个外部资源的链接提供了对结果进行深度分析。
** Wandora [http://www.wandora.org/]
Wandora是一个基于Topic Maps(ISO 13250)的通用知识抽提、管理和发布环境。Wandora支持OBO平文件v1.2格式,能够对OBO文件(包括GO)和topic map进行相互转换。Wandora对于非常适合于显示OBO以及结合OBO、RDF和Topic Map资源进行知识整合(knowledge mashups)。
** WEGO:Web Gene Ontology Annotation Plot [http://wego.genomics.org.cn/]
WEGO是一个简单但有用的工具,用于绘制GO注释结果图。与其它的商业软件的图表创建不同,WEGO设计成处理GO的有向非循环图(directed acyclic graph, DAG)结构以便于为GO注释结果创建直方图。WEGO已经在许多的生物学研究项目中得到应用,包括水稻基因组项目和蚕基因组项目。它已经成为一个下游基因注释分析的有用工具,特别适合于执行比较基因组任务。
** Whatizit [http://www.ebi.ac.uk/Rebholz-srv/whatizit/form.jsp]
Whatizit是一个web程序,重点突出在文档中所有感兴趣的东西。它的一个模块标识所有的GO术语和来自于UniProt蛋白跟基因的名称,并分别链接到GO和UniProt上。
转自:http://blog.sina.com.cn/s/blog_4ee13c2c0100v4am.html