SHMILYRINGPULL

GO分析相关工具汇总

GO委员会工具
AmiGO [http://amigo.geneontology.org/cgi-bin/amigo/go.cgi]
AmiGO 提供检索和浏览GO委员会提供的本体学(ontology)和注释(annotation)数据。用户可以通过检索蛋白获得相应的GO术语，可以检索GO术语得到相应的细节和相关的蛋白注释，AmiGO还提供了BLAST搜索引擎，比对有GO术语注释的基因和基因产物的序列。

OBO-Edit [https://sourceforge.net/project/ ... up_id=36855&;package_id=192411]
OBO-Edit是一个开源的、与平台无关的应用程序，用于显示和编辑OBO格式的本体文件.OBO-Edit是基于图的工具，强调本体的全部图结构，给生物学家提供了一个友好的接口。OBO-Edit是个很好的工具，关注于相对简单的门类的相互关系,有助于本体学的快速更新。

非GO委员会工具
用于搜索和浏览GO的工具：显示、浏览和搜索相应的本体和注释
** CGAP GO Browser [http://cgap.nci.nih.gov/Genes/GOBrowser]
提供浏览GO词汇，可以找人和小鼠基因对应的GO术语, 每隔几个月更新GO的数据。

** COBrA [http://www.xspan.org/cobra/]
一个基于Java的本体编辑器，区别于其它编辑器在于其提供了两个本体间概念上的连接，以及提供了精细的分析和验证功能。除了支持GO和OBO格式之外，COBrA还能导入和导出本体为语义web(Semantic Web)格式如RDF、RDFS、OWL。

** Comparative Toxicogenomics Database [http://ctd.mdibl.org/]
CTD是一个公用的数据库，加强了对环境中化学物质对人类健康的理解，整合了GO数据和GO浏览器。使得用户可以理解暴露在化学物质下相关靶标的生物功能、过程和细胞定位。

** DynGO [http://gauss.dbb.georgetown.edu/liblab/dyngo.html]
是一个客户端-服务器模式的应用程序，提供了许多高级的功能，除了标准的浏览功能外，DynGO允许用户批量地检索一系列基因和基因产物的GO注释，以及语义检索一系列基因和基因产物所共有的相似GO注释，结果根据GO的等级显示为树状结构，支持许多动态显示的选项如对树节点排序或改变树的方向。对于GO管理者和经常使用GO的用户，DynGO提供了快速和方便的访问GO注释数据。DynGO广泛地应用到有GO术语注释的任意数据集。

** EP GO Browser [http://ep.ebi.ac.uk/EP/GO/]
EP GO Browser是EBI的Expression Profiler中的一个组件(Expression Profiler是一个工具集，用于聚类、分析和可视化显示基因表达和其它基因组数据)，通过它，你可以搜索GO术语和识别基因相关的节点，以及相应的子节点。

** Gene Class Expression [http://gdm.fmrp.usp.br/cgi-bin/gc/upload/upload.pl]
Gene Class Expression允许使用GO数据库对SAGE数据进行功能注释。这个工具对每一个SAGE标签在GO数据库里进行搜索，对选定的GO类别和选定的等级进行关联。这个系统对于映射SAGE数据到GO结构上提供了用户友好的数据导肮和可视化。还对SAGE标签在每一个GO类别里的百分比提供了图形可视化以及置信区间和假设检验。

** GeneInfoViz [http://genenet2.utmem.edu/geneinfoviz]
GeneInfoViz是一个基于web的工具，提供批量检索基因功能信息、可视化GO结构和构建基因相关网络。用户需要提供一个基因列表(格式可为LocusLink ID、UniGeneID、gene symbol、accession number)，结果返回功能基因组信息。基于对给定基因的GO注释，GeneInfoViz允许用户以GO的DAG结构显示这些基因，以及在选定的DAG水平上构建基因相关网络。

** GeneOntology at RZPD [http://www.rzpd.de/cgi-bin/asearch/GO/go4rzpd.pl.cgi]
RZPD提供了GO标识符和相关联的UniGene ClusterIDs、Genes(Name/Symbol)、Clones的检索，目前GO注释关联了人和小鼠的基因/克隆。

** GenNav [http://mor.nlm.nih.gov/perl/gennav.pl]
检索GO术语和注释的基因产物，提供在GO DAG图中可视化显示GO术语。
?
** GOblet [http://goblet.molgen.mpg.de/]
GOblet服务器考虑了GO术语，执行序列(cDNA，蛋白)分析。如相似性搜索(BLAST),在使用已有的GO注释构建的不同物种的数据库的前提下，服务器展示了所有匹配的细节描述以及基于匹配到的GO术语构建GO概要树(summary tree)

** GoFish [http://llama.med.harvard.edu/Software.html]
GoFish是在线的java程序，也可以下载到本地运行。允许用户使用GO属性构建任意的布尔检索，对符合条件的基因产物进行排列，GoFish也对每一个基因产物估算其符合布尔查询的概率

** GONUTS [http://gowiki.tamu.edu/]
GONUTS是基于wiki的GO术语和少量物种基因关联的浏览器，wiki接口允许用户创建和分享每一个GO术语用法的注解。

** MGI GO Browser [http://www.informatics.jax.org/searches/GO_form.shtml]
通过MGI GO Browser可以搜索GO术语和显示所有小鼠基因注释到每一个术语或子术语。也可以浏览本体来观察术语之间的关系、术语定义、对于给定的术语和它的子术语所注释的小鼠基因数量。MGI GO Browser直接访问MGI数据库中的GO数据(每晚更新)。

** Ontology Lookup Service [http://www.ebi.ac.uk/ontology-lookup/]
OLS整合了公开的可用生物医学本体到单一的数据库。所有修正的本体是每天更新的。一个当前加载的本体列表可以在线获得，这个数据库能够通过检索获得单一术语的信息或使用AJAX浏览完整的本体。自动补齐提供一个用户友好的搜索机制。一个基于AJAX的本体显示器可以有效地浏览完整的本体或其子集。一个可编程接口可以通用使用SOAP来检索网络服务。服务由一个WSDL描述器描述，此文件可在线获得。一个简单的java客户端使用SOAP来连接网络服务，可以从SourceForge上下载到。所有的OLS源代码是公开的，使用Apache许可证发布。OLS提供了一个用户友好的单一入口指向公开可获得的本体(Open Biomedical Ontology格式)。

** PANDORA [http://www.pandora.cs.huji.ac.il/]
使用PANDORA可以搜索蛋白的任何非一致集(non-uniform sets)和检测共享独特生物属性的蛋白子集，以及这些集合的交集。PANDORA支持GO注释和额外的关键字(来自于UniProt Knowledgebase, InterPro, ENZYME,SCOP等等)。PANDORA被整合进ProtoNet system，从而允许测试上以万计的自动产生的蛋白家庭。PANDORA已经取代了由同一个团队开发的ProtoGO浏览器。

** QuickGO at EBI [http://www.ebi.ac.uk/ego/]
QuickGO是一个GO浏览器，由EBI开发，是InterPro的一个组件，可以搜索GO术语来观察它的相关节点和定义，还可以映射到SWISS-PROT关键词、酶分类，转运分类数据库或者InterPro入口。GO数据每日更新。

** TAIR Keyword Browser [http://www.arabidopsis.org/servl ... =new_search&;type=keyword]
搜索和浏览GO、TAIR解剖(Anatomy)、TAIR发育阶段术语(developmental stage terms)，允许显示术语的细节及其相关的术语。包括基因、文献、芯片实验和相应术语的或子术语的注释之间的关联。

** Tk-GO
这个工具是对BDGP的GO::AppHandle库基本功能的一个GUI包装。GO术语在一个explorer-like浏览器里展示，程序可以通过修改perl脚本来配置。Tk-GO使用的GO数据库(默认直接连接BDGP的数据库)是用户可以修改的。

注释工具:使用GO对基因和基因产物注释的工具

** g rofiler [http://biit.cs.ut.ee/gprofiler]
g rofiler是一个公用的web服务器，用于挖掘高通量基因组数据。g rofiler有一个简单、用户友好的网页接口，对于获取GO、通路或转录结合因子在单个基因水平上的富集等具有强大的可视化功能。除了标准的多重检验校正(multiple testing corrections)外，引进了一个对复杂结构(如GO)进行多重检验的真实效果估算的改良方法。解释基因列表通过一个高效的算法由同一接口支持。其它实用的数据分析通过模块支持。整合进g rofiler的模块有：g:Convert转换不同数据库的ID，g:Orth找寻不同物种的直向同源基因(orthologous genes)，g:Sorter搜索绝大部分的公用基因表达数据找寻共表达的数据。g rofiler支持31个不同的物种，数据定期从数据源(如Ensembl数据库)更新。生物信息学社区希望g rofiler能支持简单的文本输出。
?
** GeneTools [http://www.genetools.microarray.ntnu.no/common/intro.php]
GeneTools收集了许多基于web的工具，从许多不同的资源里收集信息，提供可用的基因组分析，两个主要的工具连接到这一数据库是NMC注释数据库V2.0和eGOn V2.0。NMC注释数据库V2.0提供了来自于UniGene、EntrezGene、SwissProt和GO的信息。

** GOanna [http://agbase.msstate.edu/GOAnna.html]
使用相似性搜索来找寻蛋白的注释，输入可以是一系列的ID或是一系列FASTA格式的序列。如有需要GOanna会检索序列，并对用户指定的数据库进行BLAST搜索。结果包含BLAST搜索到的相似性高的序列的GO注释和序列比对的结果。

** GoAnnotator [http://xldb.fc.ul.pt/rebil/tools/goa/]
此工具对从文献里提取的蛋白GO术语注释进行验证。

** GOCat:Gene Ontology Categorizer? [http://eagl.unige.ch/GOCat/]
GOCat是一个自动的文本分类器，此工具归类任意的输入文本(几个词，一篇摘要，一系列的PubMed识别符等等)到GO分类。这个系统目标在于通过文本挖掘方法方便对基因和基因产物进行功能注释。对于每一个的预测类别，提供一个置信打分和一段抽取于输入文本的简短文本。

** GoFigure [http://udgenome.ags.udel.edu/gofigure/]
对未知的检索序列通过BLAST来识别其同源的注释，以此来预测其GO注释。DNA或蛋白质序列都允许提交，多重的检索可以通过提交包含FASTA格式的文件来完成。检索到的结果通过email返回给用户，结果显示为图或者是tab分割的文件。结果可以通过tar打包文件下载。

** GoPubMed [http://gopubmed.org/]
GoPubMed是一个网络服务器，允许用户结合GO探索PubMed搜索结果，GoPubMed提交用户的关键字到PubMed，检索摘要，检测摘要中的GO术语，显示与最初检索结果相关的GO子集，允许用户通过语义浏览和显示相应的文献和它们的GO注释。

** GOtcha [http://www.compbio.dundee.ac.uk/Software/GOtcha/gotcha.html]
GOtcha提供了对于给定的检索序列相关GO术语的预测。每一个术语相对于引用搜索是分数独立(scored independently)和分数校准(scores calibrated)的，以便给出正确性的准确百分比可能性(to give an accurate percentage likelihood of correctness)。

** HT-GO-FAT:High Throughput Gene Ontology Functional Annotation Toolkit [http://liru.ars.usda.gov/ht-go-fat.htm]
HT-GO-FAT允许高通量映射未知或其它基因序列如ESTs、mRNA、蛋白数据到GO注释、EC numbers、KEGG通路。它使用序列相似性和结构域匹配。此工具使用自定义的校正数据库以及拥有诸如窗口局域网分布式BLAST(windows LAN distributed BLAST)，能够通过窗口局域网分布高通量的BLAST搜索。HT-GO-FAT还拥有高通量的BLAST输出观察器，以及能对匹配度高或人工校正的数据导出为许多的文件格式。数据能导出为AmiGO相关的文件，通路图会高亮显示用户数据集中的酶/基因。
???
** InGOt (商业软件) [http://www.inpharmatica.co.uk/ingot/]
InGOt是Inpharmatica的新模块系统中的一个模块。这个系统用于蛋白注释，是一个应用GO到所有蛋白的一个商业系统。它提供一个无与伦比的资源来阐释蛋白功能：它的图形用户界面让你轻松地从各个链接中跳转，从汇总数据到分层语境(hierachical context)和文献/证据(literature/evidence)。InGOt拥有比公开资源更为丰富的序列和最广泛的GO关联资源。InGOt可以和其它模块整合，如Domain Professor用于蛋白结构域的细节注释和Blu-Chip用于即时和准确的探测蛋白赋值(protein assignments)。

** InterProScan [http://www.ebi.ac.uk/InterProScan/]
蛋白结构域和功能位点数据库对于蛋白功能的预测是一个关键的资源。十年来，许多标识识别(signature-recognition)方法逐步形成来解决不同序列分析问题。产生不同和独立的数据库。由于强调不同的分析方法，这些资源有着各自不同的优点和缺点，各自有着不同的最优应用。从而，为了得到最好的结果，搜索策略必须完美地结合所有的资源。InterProScan是一个基于Perl的程序，它能够结合不同的蛋白标识识别方法到一个资源上。

** JAFA:Joint Assembly of Functional Annotations [http://jafa.burnham.org/]
JAFA接收蛋白序列，提交它到数个功能预测程序，并将预测结果聚集到一个单一的、易读的、基于GO术语的文件，用户可以点击各个服务器、AmiGO和QuickGO。JAFA还提供包含所有结果的XML文件下载。

** Manatee [http://manatee.sourceforge.net/]
Manatee是基于web的基因评估和基因组注释工具，Manatee能够存储和显示原核和真核基因组注释。Manatee界面允许生物学家快速识别基因以及对其进行高质量的功能赋值(诸如GO分类，使用搜索数据，paralogous家族和由自动分析所产生的注释)，Manatee能够下载和安装，运行于CGI网络服务器，比如Apache。

** PubSearch [http://pubsearch.org/]
PubSearch是基于web的文本管理工具，允许管理者搜索和注释基因到文献的关键字。它的后端有一个简单的mySQL数据库，PubSearch使用一系列Java伺服小程式和JSPs来完成检索、修改、增加基因、基因注释和文献信息。此工具可以从GMOD上下载到。

用于基因表达/芯片分析的工具

** Avadis - gene expression analysis with GO browser (商业软件) [http://avadis.strandgenomics.com/]
Avadis是基因表达数据的数据分析和可视化工具，内置一个显示GO等层的浏览器，许多基因有共同的本体途径(common ontology paths)，对基因表达聚类可以通过GO语义进行聚类以识别功能标识(functional signatures)

** BiNGO [http://www.psb.ugent.be/cbd/papers/BiNGO/]
开源的java工具，在一个基因集合里确定那个GO类别是统计上过表达(over-represented)的。BinGO以Cytoscape的插件实现，Cytoscape是分子相互作用网络数据整合和可视化的软件平台。BinGO映射给定基因集的主要功能主题到GO等级上，并输出这一映射为Cytoscape图。

** CLENCH:CLuster ENriCHment [http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/]
CLENCH允许拟南芥(A. Thaliana)研究者从TAIR上执行自动的GO注释检索并计算给定的基因集(相对于参考集)的GO术语富集。在计算富集之前，CLENCH允许把返回的注释映射到GO slim术语表(能够被用户编辑)和本地安装的GO上的任何粗糙水平，

** DAVID atabase for Annotation, Visualization and Integrated Discovery [http://david.abcc.ncifcrf.gov/]
基于web的工具，提供由高通量技术产生的基因组水平数据集(诸如表达谱和蛋白组平台)的注释和分析的整合解决方案。分析结果和图形显示保留动态链接到主要的数据库和外部数据仓库，从深度和广度上覆盖数据。DAVID为数据收集到生物意义的转变提供便利，加速了基因组水平数据的分析。

** EASE [http://david.niaid.nih.gov/david/ease.htm]
EASE对于一个给定的基因列表概述主要的生物学主题。给定的基因列表来自于表达谱或其它的基因组水平实验，EASE能够快速计算相对于数据集里所有基因每一个统计上可能的过表达GO术语。

** eGOn v2.0:explore Gene Ontology [http://www.genetools.no/]
基于web的工具，映射表达谱数据到GO结构上。多个的输入文件能够同时分析以比较两个或多个实验的注释基因的分布。
eGOn V2.0的核心特性：
.可视化：基因注释以GO DAG可视化显示或以表格的形式显示，GO DAG的尺寸能够由用户自由定义。
.过滤：GO注释能够基于evidence codes进行过滤。
.包含用户定义的GO注释：事先加入到NMC注释数据库中。
.统计分析：多个基因列表能够同时分析以比较GO等级上注释基因的分布，统计测验设计成允许用户在两个基因列表之内或之间计算GO注释的不同(dissimilarities)。
.连接注释数据库：连接到NMC注释数据库，基因和蛋白的信息直接由GO DAG或导出的数据提供。
.导出：GO DAG信息、统计结果、基因和蛋白信息能够导出为Excel、text、XML格式。

** ermineJ [http://bioinformatics.ubc.ca/ermineJ]
分析表达数据中的基因集(用户定义或通过GO术语定义)的工具。这个软件设计为给只有很少或没有信息学背景的生物学家使用。为想使用ermineJ脚本的用户提供一个命令行接口。实现了多个不同的对基因集的打分方法，不是简单地集中于依赖过分表达(over-representaion)方法上。

** FatiGO [http://www.fatigo.org/]
FatiGO对给定的基因集，以代表性的功能信息(低表达或过表达GO术语)对其赋值。通过多重检验纠正(multiple-testing correction)得到统计显著性。FatiGO被设计成在DNA芯片数据分析的上下文里进行功能注释，FatiGO链接到基因表达模式分析套件(Gene Expression Pattern Analysis Suite)里。FatiGO使用主要的基因组和蛋白组数据库(GeneBank, UniProt, Unigene, Ensembl,etc)的基因IDs。FatiGO适用于任何类型的大规模实验进行功能注释。

** FIVA:Functional Information Viewer and Analyzer [http://bioinformatics.biol.rug.nl/standalone/fiva/]
FIVA协助原核生物社区的研究者进行转录组分析时快速识别相关生物过程。此软件分析大量基因的功能谱并对影响的生物过程产生一个综合的概述

** FuncAssociate [http://llama.med.harvard.edu/cgi/func/funcassociate]
FuncAssociate是一个基于web的工具，接受一个基因列表作为输入，并返回输入列表中过表达或低表达(over- or under-represented)的GO属性。经过多重假设检验后只有那些统计上具有显著性的过表达或低表达的属性才会被报道。目前有10个物种被支持。除了输入基因列表外，用户还可以指定a)这一列表是否被认为是排序还是乱序的。b)FuncAssociate所认为的总基因(the universe of genes)。c)单独报道过表达或低表达的属性，还是两者都报道。d)p-value cutoff值。
新版的FuncAssociate(还处于测试阶段)支持更广泛的基因命名方案，并使用更为频繁更新的GO相关文件(GO associations)，然而原来版本的一些特性诸如按LOD排序或查看基因属性表格的选项还没有实现。

** FuncExpression [http://www.barleybase.org/funcexpression.php]
FuncExpression是一个基于web的资源，对大规模的基因组数据进行功能解析。FuncExpression能对植物、动物和真菌的基因列表(从基因组和蛋白组实验中产生)进行功能比较。多个的基因列表能够被分类、比较和可视化显示。FuncExpression支持双通道整合(two way-integration)植物功能信息和基因表达数据，这使得后续的交叉验证(cross-validation)成为可能，交叉验证使用BarleyBase相关实验获得的植物芯片数据。

** FunCluster:FunCluster, Functinal Profiling of Microarray Expression Data [http://corneliu.henegar.info/FunCluster.htm]
FunCluster是一个基因组数据分析工具，设计成对cDNA芯片实验产生的基因表达数据进行功能分析。除了自动对基因表达数据进行功能注释外，FunCluster通过特定设计的共棸类对涉及到的生物注释和基因表达数据进行功能分析，能够检测出共调控的生物过程(注释基因组主题所展示)。FuncCluster的功能分析依赖于GO和KEGG注释，并且只支持三个物种：人(Homo sapiens)、小鼠(Mus musculu)和酿酒酵母(Saccharomyces cerevisiae)。

** FunNet:Functional Analysis of Transcriptional Networks [http://www.funnet.info/]
FunNet设计为一个分析基因共表达网络(由芯片表达数据所构建)的整合工具，此工具的分析模块的实现涉及到两个抽像层：转录(如基因表达谱)和功能(如转录分析所显现的生物学主题)。依赖于GO和KEGG注释的功能分析技术，应用于从基因芯片表达数据中抽提一系列相关生物学主题。多重情况表达(multiple-instance representations)用来关联注释转录本和相关的生物学主题。一个原创(original)的非线性动态模型被用来量化相关基因组主题(genomic themes)上下文的接近度，这一量化基于在基因共表达网络(如在注释主题中捕获转录本的相似的表达谱)中基因组主题的增殖模型(patterns of propagation)。最后，一个非监督的多重情况光谱聚类过程(an unsupervised multiple-instance spectral clustering procedure)被用来探索共表达网络的模块结构，这是通过聚集共表达网络所显示出来的显著性相互关系的生物主题来实现的。提供了共表达网络的功能、转录表达、相关的转录和基因组主题的上下文详细信息。
FunNet提供了基于web的工具以及作为一个标准的R包。标准R实现能够运行在任何能运行R环境的操作系统(windows, Mac OS, 各种Linxu和Unix)上，能够从FunNet网站或者从CRAN的镜像站上下载到。两种实现的FunNet都是使用GPL2.0发布的。

** G-SESAME [http://bioinformatics.clemson.edu/G-SESAME/]
G-SESAME包含了一系列工具，分别是：
1.衡量GO术语语义相似性的工具。
2.衡量基因功能相似性的工具。
3.基于GO术语注释信息聚类基因的工具。

** GARBAN [http://www.garban.org/garban/home.php]
GARBAN是对cDNA芯片和蛋白质组技术产生的数据进行分析和快速功能注释的工具，GARBAN实现为生物信息学工具，以快速比较、分类和图形展示各种数据集(genes/ESTs或proteins)，目的在于为病理和药学研究中识别分子标记(molecular markers)提供便利。GARBAN链接到主要的基因组和蛋白质组数据库(Ensembl, GeneBank, UniProt Knowledgebase, InterPro,etc.)并遵循GO委员会的标准进行语义分类。代码是共享的: e-mail [email protected]

** GENECODIS [http://genecodis.dacya.ucm.es/]
GENECODIS是一个基于web的对基因列表进行功能分析的工具，它整合了不同的信息资源来搜索最频繁的共存在基因集的注释，并通过统计显著性排列它们。注释分析来自于不同的数据库如GO,KEGG或SwissProt。

** GeneMerge [http://www.oeb.harvard.edu/hartl ... erge/GeneMerge.html]
GeneMerge对于一个给定的基因集返回功能基因组信息，并提供此基因集里过表达的特定功能或分类的统计秩值(statistical rank scores)。展示了所有的GO类别和功能基因组数据。

** GFINDer: Genome Function INtegrated Discoverer [http://www.medinfopoli.polimi.it/GFINDer/]
GFINDer是一个多重数据库系统(multi-database system)提供了大规模的用户分类的序列标识列表和基因组生物学信息以及列表中不同基因类别的特征生物学功能谱。GFINDer自动从不同的资源检索更新功能分类的注释信息，识别用户分类的基因列表中每个分类的富集类别。并计算每一个类别的统计显著性。而且，GFINDer能够根据挖掘的功能类别对基因进行功能分类并且对这些分类进行统计分析，使得能够更好地解释芯片实验结果。

** GOALIE: Generalized Ontological Algorithmic Logical Invariants Extractor [http://bioinformatics.nyu.edu/Projects/GOALIE/]
GOALIE是用来构建时间序列依赖富集的工具，需要ODBC连接到GO数据库。

** GOArray [http://ycmi.med.yale.edu/gomine]
GOArray是一个Perl程序，输入一系列基因注释为“感兴趣(of interest)”(GOI)或者不感兴趣，并确定相关的GO术语对于GOI是否过表达。一个置换检验(permutation test)是可选的，用来评估结果的可靠性。输出包括了多个可视化图和补充信息以及进一步的参考，还有对所使用的统计方法的概述。

** GOdist [http://basalganglia.huji.ac.il/links.htm]
GOdist是一个Matlab程序，用于分析Affymetrix芯片表达数据，实现了Kolmogorov-Smirnov(KS)连续统计方法。还引入一个两侧超几何分布(two-tailed hypergeometric distribution)使用Fisher exact检验实现了离散方法。GOdist能够检测出芯片基因相关的GO术语相对于不同总体的差别，总体可是是全局芯片总体、分析的GO术语的直接父节点或全局父节点。

** GOHyperGAll [http://faculty.ucr.edu/~tgirke/D ... oCondManual.html#go]
检验样本总体基因得到过表达的GO术语，R/BioC函数GOHyperGAll对所有的GO节点进行超几何分布检验计算并返回相应的P值，后续的过滤函数使用默认的或自定义的GO Slim类别执行GO Slim分析，使用此工具必须有基本的R和BioConductor知识。

** GoMiner and MatchMiner [http://discover.nci.nih.gov/gominer/htgm.jsp]
High-Throughput GoMiner是一个工业级别的整合GO工具，用于解析多芯片实验。GOMiner是基于Java的程序包，对感兴趣的基因(如芯片实验里上调或下调基因)在GO的上下文里进行生物学解析。GoMiner提供定量和统计的输出文件和两个有用的可视化文件：(i)树状结构类似于AmiGO浏览器里所显示的(ii)一个压缩的，动态交互的DAG。GoMiner所展示的基因链接到主要的公开生物信息学资源。一个陪伴工具(companion)MatchMiner用于做前处理，为GoMiner或其它的GO工具的输入获取基因名称，提供了一个自动化脚本以便于安装本地化的数据库。

** GOstat [http://gostat.wehi.edu.au/]
GOstat是一个易于使用的web工具，用于确定基因列表中过表达或低表达的GO类别的统计显著性。数据每月更新。

** GoSurfer [http://biosun1.harvard.edu/complab/gosurfer/]
GoSurfer在分析基因集(来自于基因组范围的计算、芯片分析或其它相应的高端方法)时使用GO信息，GoSurfer包含了严格的统计检验，交互的图形和自动更新注释信息(基因标识符(UniGene,LocusLink)或Affymetrix探针集)。

** GO Term Finder [http://search.cpan.org/dist/GO-TermFinder/]
GO Term Finder对给定基因列表的基因产物的GO术语或其父节点作显著性的分析。Saccharomyces Genome Database 实现了一个基于web的GO Term Finder用于为出芽酵母基因产物搜索注释。一个通用的GO Term Finder由Standford Microarray Database创建，可以从CPAN下载到。这个代码被普林斯顿基因组研究组(Princeton genomics group)用于创建基于web的通用GO Term Finder，通过该web工具提供了分析GO站点上所公开的有GO注释的任何种属(包括人)的基因。

** GOTM:Gene Ontology Tree Machine [http://bioinfo.vanderbilt.edu/gotm/]
GOTM是一个基于web的工具，基于GO等级结构分析和显示感兴趣的基因集。这个工具提供了用户友好的数据导航和可视化。产生可扩展的树用于浏览GO等级结构，以HTML的形式生成固定的树用于对不同注释水平进行归档并生成柱状图，GOTM提供统计分析以显示GO类别和相对富集的基因数目以及暗示(suggest)了进一步研究的生物领域。富集的GO类别能够以子树或DAGs的形式展示。基因的子集能够检索GO术语或进行关键字搜索。每一个基因的细节信息能够直接从GeneKeyDB里检索到。

** GOToolBox [http://gin.univ-mrs.fr/GOToolBox/]
GOToolBox是一系列基于web的程序，允许从一个基因集(相对于被检索的参考基因集)识别统计上过表达或低表达的术语、基因集里对功能相关的基因进行聚类和检索基因集里共享的注释。GO注释能够限制在GO slim等级上或者是给定的GO术语水平上，而且术语可以使用evidence codes进行过滤。GO和基因关联文件每月更新。

** L2L [http://depts.washington.edu/l2l/]
L2L是一个简单但功能强大的工具，用于发现芯片数据中隐藏的生物学显著性，通过易于使用的web界面，L2L挖掘GO术语显著富集的上调或下调的基因，L2L还将基因列表与数据库中上以千计的芯片实验作比较，以识别共有的基因调控模式。此工具可以下载到一个命令行的版本，可以自定义运行或者批量分析。

** Machaon Clustering and Validation Environment [https://www.cs.tcd.ie/Nadia.Bolshakova/Machaon.html]
Machaon Clustering and Validation Environment是一个聚类验证的工具，将样本或基因按相似的基因表达模式进行分类并评估聚类的质量。在基因表达数据分析中GO术语用于衡量基因间的相似性(生物学距离)以支持生物医学知识发现(biomedical knowledge discovery)。

** MAPPFinder [http://www.genmapp.org/MAPPFinder.html]
MAPPFinder是GenMAPP的辅助程序。这个程序允许用户检索任何存在的，相对于GO基因相关和GenMAPP芯片通路谱(MAPPs, microarray pathway profiles)的表达谱数据标准。分析产生的结果能够通过选择感兴趣的术语或MAPPs直接以GO等级或在GenMAPP中展示出来。

** Onto-Compare [http://vortex.cs.wayne.edu/projects.htm#Onto-Compare]
Onto-Compare是一个基于web的工具，可以基于GO对商业芯片进行比较。Onto-Compare允许用户对每一个芯片做功能偏好性评估并确定对于某个特定生物学现象(由GO术语描述)最好的芯片。

** Onto-Design [http://vortex.cs.wayne.edu/projects.htm#Onto-Design]
Onto-Design允许用户设计定制芯片，通过选择一系列UniGene cluster IDs，这些IDs代表了一个给定的生物过程子集(使用GO术语描述)。

** Onto-Express [http://vortex.cs.wayne.edu/projects.htm#Onto-Express]
Onto-Express搜索公共数据库并返回一系列表格，包换相关表达谱、基因细胞发生定位(cytogenetic gene locations)、生物医学和分子功能、生物过程、细胞组分和翻译的蛋白的细胞功能。

** Onto-Miner [http://vortex.cs.wayne.edu/projects.htm#Onto-Miner]
Onto-Miner允许用户通过clone ID, UniGene gene symbol, LocusLink ID, accession number等搜索不同的公开生物信息学数据库，允许使用基因列表进行批量检索。第三方开发者可以把这个站点作为资源，提供对于任意的基因列表的详细基因信息。

?? * Onto-Translate [http://vortex.cs.wayne.edu/projects.htm#Onto-Translate]
Onto-Translate是基于web的工具，允许用户对下列ID进行快速转换：accessions IDs, Unigene cluster IDs 和Affymetrix probe IDs。Onto-Translate使用不同的数据库并降低任意基因列表的冗余，帮助识别相同的信息。

** OntoGate [http://functionalgenomics.de/ontogate/]
OntoGate提供使用GO术语和与GO术语相关的外部数据库进入GenomeMatrix(GM)的入口，以找寻GM中不同物种的基因，这些基因能到映射到GO术语上。OntoGate包含了对相应注释基因的氨基酸序列进行BLAST搜索。

** Ontologizer [http://www.charite.de/ch/medgen/ontologizer/]
Ontologizer能够对一组或多组基因或基因产物产生相应的GO注释，并根据每一个聚类的使用频率进行排列，以HTML或XML格式显示。如果提供了总体的数据集，程序会对每一个GO术语执行过表达的统计分析。产生“Dot"(GraphViz)文件对过表达的GO术语提供图形化概述。提供了每一个基因的详细列表。

** Ontology Traverser [http://franklin.imgen.bcm.tmc.ed ... e=OntologyTraverser]
Ontology Traverser是芯片基因列表富集工具，此工具为一些cDNA芯片和相对于芯片类型所使用的所有探针/克隆集列表提供了简单的上传格式，接收AffyIDs和NIAIDs。支持许多报告格式：flat html,flat tsv, xml和展示GO结构的动态可点击HTML。对每一个GO节点报告不同的统计/结果:列表fq, 芯片fq, fold change,? Fisher's exact test P值和基因的映射到的节点或子节点的标识。

** Probe Explorer [http://probeexplorer.cicancer.org/]
Probe Explorer是一个开放使用的基于web的生物信息学程序，显示芯片寡核苷酸探针和在基因组上下文中的转录本的关联，此软件很灵活，可以简单地作为基因组和转录组的浏览器。提供了15种后生动物(metazoa)和两种酵母提供基因组实体(genomic entities)(位点, 外显子, 转录本)的序列和对等物包括矢量图输出。序列比对工具用来建立Affymetrix芯片探针序列和转录组(人，小鼠，大鼠和酵母)之间的关联。提供使用任何的DNA或蛋白序列进行关键字搜索、用户搜索和在基因组上进行比对。

** ProfCom: ProfCom, Profiling of Complex Functionality [http://webclu.bio.wzw.tum.de/profcom/]
ProfCom是基于web的工具，用于对实验相关的基因列表进行功能解释。使得ProfCom成为独特工具的一个特征是除了GO术语外还可以使用复杂函数(complex function)进行富集分析。复杂函数由可用的GO术语的布尔组合构建。ProfCom对复杂函数作推断能够更加特异地比较单个的术语并更为准确地描述基因的功能。

** SeqExpress [http://www.seqexpress.com/]
SeqExpress是一个综合的分析和可视化软件包，用于基因表达实验。组合了特定开发的技术和通用的统计学方法，GO被用来对聚类的功能富集进行打分。这些结果能够在内嵌的浏览工具或通过通过网页进行浏览。SeqExpress还支持许多数据转换，投影(projection)，可视化显示，文件输入/输出，搜索，与R整合，和聚类等选项。

** SerbGO [http://estbioinfo.stat.ub.es/apli/serbgo/]
SerbGO是基于web的工具，帮助研究者确定那一个基因芯片分析工具、GO语义分析工具适合他们的项目。SerbGO是一个双向(bidirectional)程序。用户能通过检索表单索要感兴趣的工具的特性，用户还能比较每一个工具所实现的特性。

** SOURCE [http://source.stanford.edu/]
SOURCE编辑来自多个公开访问的数据库(包括UniGene, dbEST, UniProt Knowledgebase, GeneMap99, RHdb, GeneCards和LocusLink)的信息，SOURCE使用的GO术语与LocusLink相关。

** Spotfire Gene Ontology Advantage Application (商业软件) [http://www.spotfire.com/services/advantage.asp]
Spotfire Gene Ontology Advantage Application整合GO注释和基因表达分析。研究者在DecisionSite里可视化地选择一个子集的基因，软件展示了基因的GO等级分布。类似地，在GO等级里选择任何的过程、功能或细胞定位可以在DecisionSite里可视化地显示其相应的基因。

** STEM: Short Time-series Expression Miner [http://www.cs.cmu.edu/~jernst/stem/]
STEM是一个Java程序，用于聚类、比较和可视化短时间序列的基因表达数据(少于或等于8个时间点)。STEM允许研究者识别显著性的时间表达谱和与这些表达谱相关的基因，并比较不同条件下这些基因的行为。STEM完整地整合了GO数据库，并支持对具有相同的时间表达谱的基因集做GO类别富集分析。STEM还支持对特定GO类别的基因行为进行简易的识别和可视化，识别在这些基因中那些时间表达谱被富集。

** T-Profiler [http://www.t-profiler.org/]
T-Profiler使用t检验对预定义的基因集的平均活性改变进行打分。基因集分别基于GO类别、ChIP-chip实验、上游与相应的转录因子结合模体匹配、在相同染色体上的定位进行定义。一个大折刀(jack-knife)过程使得计算比其它软件要更为稳健。T-Profiler使得对芯片数据进行解析以直观和严格统计成为可能，而不需要结合实验或者选择参数。

** THEA:Tools for High-throughput Experiments Analysis [http://thea.unice.fr/index-en.html]
THEA是一个整合的信息处理系统，用于分析后基因组数据。可以自动化进行数据(由通过选择的生物学信息包括GO进行分类)注释。用户可以对这些注释手动搜索和浏览，或根据统计标准(数据挖掘)产生有意义的概述。

其它工具

** APID：Agile Protein Interaction Data Analyzer? [http://bioinfow.dep.usal.es/apid/index.htm]
APID是一个交互的生物信息学web工具，在一个统一的和比较性的主要平台，用于整合和分析，目前已知的信息是由特定的小规模或大规模的实验方法所展示的蛋白质相互作用。目前，此应用程序包含来自于5个主要数据库资源的信息，装入于单一服务器以探索4万个不同蛋白和接近于15万已证实的不同相互作用。网站包含搜索工具以检索和浏览数据，允许通过计算的参数选择相互作用对，这些参数衡量每一个特定的蛋白相互作用的可靠性。蛋白的参数是连通性、聚类系数、GO功能环境、GO环境富集;相互作用方式的数目、GO重叠(GO overlapping)、iPfam结构域-结构域相互作用。APID同样包含了一个图形互动的工具用来显示选择的子网或者整个网络以及对其导航。

** Blast2GO [http://www.blast2go.de/]
B2G基于GO注释和功能分析进行相似性搜索。B2G对基因功能信息可能性提供直接的统计分析并在GO有向非循环图中高亮显示相应的功能特性。而且B2G包含了不同的统计图表概述了包括BLASTing、GO映射、注释和富集分析(Fisher's Exact Test)。所有的分析过程是可配置的以及支持在任何分析阶段进行数据的输入和输出。这一程序同样接受已存在的BLAST或注释文件并将它们加入到后续的分析中。这个工具还提供了非常合适的平台来进行非模式生物的高通量功能基因组研究。B2G是一个不依赖于物种、直观和互动的桌面程序，允许监示和理解整个注释和分析过程，分析过程支持附加的特性如GO Slim整合，考虑evidence code(EC)，批量模式或GO多水平饼图。

** Db for Dummies! [http://www.dbfordummies.com/go.asp]
DBD是一个小数据库，导入GO Slim，它允许数据以树的形式显示。

** Flash GViewer [http://www.gmod.org/flashgviewer/]
Fash GViewer是一定制的Flash电影能够轻易地被嵌入到网页以显示染色体上单独特性的位点。它试图提供特定特征集(如基因相关的特定GO术语等)的基因组位点的概述，而不是显示基因组的特性。特性能超链接到外部的网页以获得细节信息，使得GView能够作为一个导航工具。提供了大鼠、小鼠、人和线虫的基因组图谱(其它的基因组图谱也能够创建)。注释数据以静态的文本文件提供或者通过服务器端的脚本产生XML文件。
这个工具不是GO特异的，但是设计成可以显示GO注释数据。

** FunSpec [http://funspec.med.utoronto.ca/]
FunSpec是一个基于web的工具，对基因和蛋白集(如共调控基因、蛋白复合体、基因相互作用)基于已存在的注释包括GO术语进行统计评估。

** FuSSiMeG:Functional Semantic Similarity Measure between Gene Products [http://xldb.di.fc.ul.pt/rebil/ssm/]
能够通过比较基因注释中GO术语间的语义相似性来衡量基因产物间的功能相似性。还可以对任意GO术语进行语义相似性评估。

** Generic GO Term Mapper [http://go.princeton.edu/cgi-bin/GOTermMapper]
Generic GO Term Mapper映射基因列表中的粒状GO注释(granular GO annotations)到更为广泛、更高水平的GO父节点术语(有时候索引到GO Slim术语上)，允许把基因归到更大的类别里。

** Genes2Diseases [http://www.bork.embl-heidelberg.de/g2d/]
Gene2Disease是一个映射到人类遗传疾病的候选基因的数据库。通过使用分析相关的表型特征和生化实体(chemical objects)、从生化实体到GO蛋白功能术语以及基于MEDLINE和RefSeq数据库产生了本数据库。能够用来显示特定遗传疾病相关的所有GO术语。

** GO Slim Mapper [http://db.yeastgenome.org/cgi-bin/GO/goTermMapper]
GO Slim Mapper用来注释出芽酵母基因产物，使用SGD GO Slim集，映射特定的粒状GO术语(granular GO terms)到相应的更为通用的GO slim父节点术语上。

** GO Terms Classification Counter [http://www.animalgenome.org/bioinfo/tools/countgo/]
GO Terms Classification Counter以一个包含GO术语IDs的格式化或非格式化文本文件作为输入，用户选择以下可供选择的类别如GO_slim、GOA、EGAD、MGI_GO_slim或GO-ROOT，程序执行计数，并返回结果于网页上(如果时间长的话，程序会给用户发送含有结果的链接)。结果包含了计数表格、百分比和一个饼图。

** GOBU:Gene Ontology Browsing Utility [http://gobu.iis.sinica.edu.tw/]
GOBU是一个基于Java的程序，使用GO和用户定义的等级两大目录(catalogs)在一个可扩展的体系下整合生物学注释目录(biological annotation catalogs)。GOBU拥有以下的特性 1)用户特定的等级数据作为输入数据，(2)用户定义描述不同注释的数据类型，(3)一个处理用户定义的数据类型的可扩展软件体系。

** GOChase [http://www.snubi.org/software/GOChase/]
GOChase是一系列基于web的工具，用于检测和纠正基于GO注释的错误。
.GOChase-History解决所有GO IDs修改的历史。
.GOChase-Correct高亮显示整合的GO IDs和重定向到正确主术语并进一步到整合的二级ID。对于过时的GO术语，GOChase推荐使用最短距离的非丢弃父术语。这个功能被用于GO浏览器如AmiGO和QuickGO以修复失效的超链接。
.完整的数据库(如LocusLink)可以作为平文件载入到GOChase里，报导注释错误和GOChase的纠正。
.当给一个GO ID输入时，GOChase会给出所有主要数据库里被这一GO ID所注释的所有基因产物。

** GOProfiler [http://agbase.msstate.edu/GOProfiler.html]
GOProfiler对AgBase中可用的GO注释提供一个概述。用户提供一个物种(分类学id)，GOProfiler显示此物种GO相关的数目和蛋白注释的数目。结果以evidence code列出，并提供了一个未被注释的蛋白列表。

** GORetriever [http://agbase.msstate.edu/GORetriever.html]
用户提供一个蛋白ID列表，GORetriever在AgBase里搜索相应的GO注释，目前支持的ID类型是Uniprot ID、Uniprot Accession、GO ID。GORetriever产生蛋白和相应注释的列表以及一个没有GO注释的入口列表(list of entries)。没有GO注释的列表可以作为Goanna工具的输入以寻找相似序列(如果有注释的话会提供)。

** GOSlimViewer [http://agbase.msstate.edu/GOSlimViewer.html]
GOSlimViewer对一个数据集提供高水平的GO类别概述。它设计成使用GORetriever的输出。你可以为GORetriever文件添加附加的注释(来自于GOanna或其它的资源).GOSlim Viewer目前只支持GOSlim集。

** ProteInOn [http://xldb.fc.ul.pt/biotools/proteinon/]
ProteInOn能够找寻相互作用的蛋白、找寻相应的GO术语并计算蛋白相似的功能语义并获取信息内容和计算每个GO术语的功能语义相似性。

** TXTGate [http://www.esat.kuleuven.ac.be/txtgate]
TXTGate基于web-service，结合选择的公开生物学资源的文献索引到一个灵活的文本挖掘系统以分析不同的基因集。通过裁剪词汇表(tailored vacabularies)、选择文本文件、LocusLink的MedLine摘要和索引SGD。子聚类(subcluster)和到各个外部资源的链接提供了对结果进行深度分析。

** Wandora [http://www.wandora.org/]
Wandora是一个基于Topic Maps(ISO 13250)的通用知识抽提、管理和发布环境。Wandora支持OBO平文件v1.2格式，能够对OBO文件(包括GO)和topic map进行相互转换。Wandora对于非常适合于显示OBO以及结合OBO、RDF和Topic Map资源进行知识整合(knowledge mashups)。

** WEGO:Web Gene Ontology Annotation Plot [http://wego.genomics.org.cn/]
WEGO是一个简单但有用的工具，用于绘制GO注释结果图。与其它的商业软件的图表创建不同，WEGO设计成处理GO的有向非循环图(directed acyclic graph, DAG)结构以便于为GO注释结果创建直方图。WEGO已经在许多的生物学研究项目中得到应用，包括水稻基因组项目和蚕基因组项目。它已经成为一个下游基因注释分析的有用工具，特别适合于执行比较基因组任务。

** Whatizit [http://www.ebi.ac.uk/Rebholz-srv/whatizit/form.jsp]
Whatizit是一个web程序，重点突出在文档中所有感兴趣的东西。它的一个模块标识所有的GO术语和来自于UniProt蛋白跟基因的名称，并分别链接到GO和UniProt上。

转自：http://blog.sina.com.cn/s/blog_4ee13c2c0100v4am.html

你可能感兴趣的:(bioinformatics)

推荐一份生物信息学入门很好的参考材料小明的数据分析笔记本
链接是https://bioinformatics.uconn.edu/resources-and-events/tutorials-2/这个是康涅狄格大学（UniversityofConnecticut）提供的一份教程，主要的内容包括1、生物信息学中经常用到的文件格式image.png2、linux操作系统和R语言的基础知识image.png3、转录组数据的处理流程image.png这里包括有参
Bioinformatic workflow 小潤澤
给大家推荐个网站：https://bioinformaticsworkbook.org/projectManagement/Intro_projectManagement#gsc.tab=0这个网站适合于刚入门的生物信息同学，里面涉及到一些NGS的流程软件介绍以获得原作者的授权：原推文链接：https://twitter.com/tangming2005/status/12401074132289
使用GC含量归一化对深度测序数据的拷贝数变化进行无对照calling 亦是旅人呐
这次分享的是来自瑞士苏黎世联邦理工学院计算机科学系ValentinaBoeva教授于2011年发表在BIOINFORMATICS(IF:6.937,2020)上的文章Control-freecallingofcopynumberalterationsindeep-sequencingdatausingGC-contentnormalization。简要我们提出了一种利用深度测序数据进行无对照拷贝数
STAR: ultrafast universal RNA-seq aligner sunlight_yy
DobinA,DavisCA,SchlesingerF,etal.STAR:ultrafastuniversalRNA-seqaligner[J].Bioinformatics,2012,29(1).ABSTRACTMotivation:高通量RNA-seq数据的准确比对是一个具有挑战性但尚未解决的问题，因为转录结构不连续，读取长度相对较短且测序技术的通量不断提高。当前可用的RNA-seq比对仪遭
突然发现基本都是临床医生、医学生在搞纯生信数据挖掘 SCI狂人团队
在2016年之前，你在PubMed上搜索meta分析这个关键词会发现大部分相关的文章都是来自国内***医院或者***医科大学；而在2016年之后，来自国内***医院或者***医科大学的meta分析类文章数量明显下降，而在PubMed上输入TCGA、GEObioinformatics这些关键词会发现越来越多来自国内***医院或者***医科大学的文章。从这些文章数量的变化可以看出，由于很多单位政策的改
单细胞scRNA-seq测序基础知识笔记是土豆大叔啊！ AI4Science 笔记数据分析
单细胞scRNA-seq测序基础知识笔记scRNA-seq技术scRNA-seq分析流程数据预处理聚类标准化数据筛选有用的数据数据降维聚类Clustering注释细胞类型scRNA数据分析结尾该笔记来源于B站up江湾青年以及CostaLab-BioinformaticsCourse关于scATAC-seq的请移步scRNA-seq技术首先是如何测序，上图瓶中有很多细胞，然后让这些细胞一个一个进入右
单细胞scATAC-seq测序基础知识笔记是土豆大叔啊！ AI4Science 笔记生物信息数据分析
单细胞scATAC-seq测序基础知识笔记单细胞ATAC测序前言scATAC-seq数据怎么得出的？该笔记来源于CostaLab-BioinformaticsCourse另一篇关于scRNA-seq的请移步单细胞ATAC测序前言因为我的最终目的是scATAC-seq的数据，所以这部分只是分享下我刚学的（不是）相关的生物学知识，而且我本身也没有生物学的背景知识，所以我尽量从计算机专业的角度去理解这些
学习小组Day7——宣Xuanan 宣Xuanan
因为课题就是做转录组测序的，所以基础知识有一些了解，接下来从数据处理部分开始进行笔记。数据初步分析：使用fastqc进行质量分析，这是一款Java软件，支持多线程。写这篇文章的时候版本是v0.11.7。软件前期准备：下载方式有两种：官网下载好用filezilla导入linux服务器直接在服务器中wgethttp://www.bioinformatics.babraham.ac.uk/project
昨日收获 - 在了解微信机器人开发的过程中生信石头
写在前面Emmm...五六年前，还在bioinformatics*中国当群管的时候，我大体写了一个简单的QQ机器人。那会使用的是已有的perl模块。能做的事情也不多，基本就是实现一个QQ聊天界面的数据库操作与字词识别并自动回复。使用已有模块的好处是可以快速达成简单需求。但是这也意味着各个地方会受限，比如开发者不再开发，或者开发者设立相对较高的授权费。这两日没什么事情，于是我又搜索了一些相关的资料，
卡梅计算机生物专业怎么样,美国卡梅生物信息学专业录取案例 weixin_39683863 卡梅计算机生物专业怎么样
宫同学基本情况本科学校：山东大学；gpa:85.44;托福：107；gre:3.5录取Carnegiemellonuniversity卡耐基梅隆大学computationalbiology计算机生物学Universityofmichigan,annarbor密歇根大学安娜堡分校bioinformatics生物信息学Georgiainstituteoftechnology佐治亚理工学院bioinfo
生物信息网站集合庐山星晖
1.常用门户：美国国家生物技术信息中心(NCBI)：https://www.ncbi.nlm.nih.gov欧洲生物信息学研究所(EMBL-EBI)：https://www.ebi.ac.ukUCSCGenome：http://genome.ucsc.edu国际生物信息学动态及会议：http://www.bioinformatics.orgSeqAnswer国际生物信息技术问答论坛：http://
使用 ChatGPT 为生物信息学初学者赋能简说基因-专业生信合作伙伴 chatgpt 人工智能
论文：EmpoweringBeginnersinBioinformaticswithChatGPT.2023对于生信初学者而言，最大的困难是身边没有经验丰富的人给予指导。而ChatGTP的出现可能改变这一现状，学生可以自己作为导师，指导ChatGPT完成数据分析工作。众所周知，与ChatGPT互动，给予的指令越精确，那么它给出的答案越精准。这篇论文提出一个与ChatGPT互动的模型：OPTICAL
2022新版TCGA批量下载表达矩阵及临床信息科研小徐
#BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")#BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")gdcdata=function(i){library(TCGAbiolinks)projects%as.data.frame()%>%select(proje
DeepPhos代码复现流程学诠生物信息 Python python pip keras tensorflow 神经网络深度学习
背景介绍本文复现蛋白质磷酸化领域经典论文DeepPhos：《DeepPhos:predictionofproteinphosphorylationsiteswithdeeplearning》，发表在《Bioinformatics》期刊上，由FenglinLuo、MinghuiWang、YuLiu、Xing-MingZhao和AoLi共同撰写。文章提出了一种名为DeepPhos的新型深度学习架构，用
肺癌相关文献5 愿航生物信息学
第十一篇IdentifyingprognosticgenesrelatedPANoptosisinlungadenocarcinomaanddevelopingpredictionmodelbasedonbioinformaticsanalysisIF:4.6中科院分区:2区综合性期刊亮点1.免疫得分方法：TIMER,quanTIseq,CIBERSORT,xCell,MCPcounter,and
GTDB-Tk v2: memory friendly classification with the Genome Taxonomy Database, 物种注释和进化树构建工具使用及介绍小果运维生信分析-bioinfo 数据库 GTDB-tk 基因组分类工具物种注释
资源介绍：GTDB-Tkv2:memoryfriendlyclassificationwiththegenometaxonomydatabase|Bioinformatics|OxfordAcademic(oup.com)GTDB-GenomeTaxonomyDatabase(ecogenomic.org)大家自己看吧，不在解释了，直接上安装和配置，然后再使用。github地址：GitHub-Ec
推荐植物生物信息学参考书Plant Bioinformatics Methods and Protocols》third edition 小明的数据分析笔记本
找论文的时候偶然发现的这本参考书，个人感觉内容还挺丰富的，在这里推荐给大家书名是《PlantBioinformaticsMethodsandProtocols》thirdedition我看了下是2022年出的是最新的一版，全书总共28章第一章UsingGenBankandSRA介绍了genbank和sra数据库的一些内容第二章ScriptingAnalysesofGenomesinEnsemblP
分子生物学数据库和软件 weixin_30892987 数据库 java 操作系统
核酸数据库EMBLDatabase欧洲分子生物学实验室（EuropeanMolecularBiologyLaboratory）核酸序列数据库，为欧洲最主要的核酸序列数据库，世界两大核酸数据库之一。目前此数据库由其分支机构—EBI（theEuropeanBioinformaticsInstitute，欧洲生物情报研究所）维护。GenBank美国国家生物技术情报中心（NCBI，NationalCent
会议 | 宏基因组和生物信息学进行病原检测的进展和未来胡童远
文献信息文章：Currentprogressandfutureopportunitiesinapplicationsofbioinformaticsforbiodefenseandpathogendetection:reportfromtheWinterMid-AtlanticMicrobiomeMeet-up,CollegePark,MD,January10,2018杂志：Microbiome时
Frontiers in Bioinformatics这本期刊是否值得投纯生信？ SCI狂人团队
有粉丝说FrontiersinBioinformatics这本期刊是否值得投纯生信？这个就要看你的发文目的。如果你需要发SCI论文，这本期刊就不适合你，因为它不是SCI期刊，不被SCI数据库收录。这本期刊仅被下面这些数据库收录：GoogleScholar,CrossRef,SemanticScholar,CLOCKSS,OpenAIRE。如果你不在意这本期刊不是SCI期刊，那就可以投这本期刊。Fr
Venn-韦恩图绘制陈洪瑜
在线工具http://bioinfogp.cnb.csic.es/tools/venny/index.html最多四个http://bioinformatics.psb.ugent.be/webtools/Venn/最多五个，多于五个仅列出共用数目http://jvenn.toulouse.inra.fr/app/example.html最多六个http://genevenn.sourceforg
点点点 | 真香！Simple GO GSEA 富集分析 ~ 生信石头
写在前面时间拨回去2015年，那时我接触生信已有一年，TBtools开发尚在萌芽阶段。那会，我写了几款小的软件，包括“blast3go”，为的是应对即将收费的“blast2go”。当然，后来相关功能都整合到TBtools中。而其中有一个重点功能，即GO富集分析。那会在Bioinformatics中国社群，我们开始了理论上是国内最早的公开社群学术Seminar（网络直播），我在其上也分享了相关学习经
5+氧化应激+WGCNA+ceRNA+分子对接，网药纯生信也能轻松发5+？生信风暴论文阅读
今天给同学们分享一篇生信文章“NetworkPharmacologyandBioinformaticsStudyofGeniposideRegulatingOxidativeStressinColorectalCancer”，这篇文章发表在IntJMolSci期刊上，影响因子为5.6。结果解读：丁香苷的目标网络图构建作者分别通过SwissTargetPrediction、TargetNet、CTD
跟着Briefings in Bioinformatics学数据分析：植物线粒体基因组组装流程GSAT初步尝试小明的数据分析笔记本
论文Mastergraph:anessentialintegratedassemblymodelfortheplantmitogenomebasedonagraph-basedframeworkhttps://academic.oup.com/bib/article-abstract/24/1/bbac522/6854450?redirectedFrom=fulltext&login=falseb
signalP6.0本地化安装与使用 CAAS_IFR_zp python
今天来下载本地化的signalP6.0在线网址如下（也挺好用的）：SignalP6.0-DTUHealthTech-BioinformaticServices还是很方便的本地化主要是处理服务器上很多文件的时候，一个个在线提交太麻烦了，就直接在服务器预测吧！在刚刚的官网点击Downloads，有fast和slow模式，主要是得到的结果不一样吧，这里选择fast填写名字，机构，邮箱等信息，阅读许可之后
5+共病+WGCNA+机器学习+免疫浸润，经典共病生信思路，轻松拿5+ 生信风暴论文阅读
今天给同学们分享一篇生信文章“Identificationofbiomarkersforthediagnosisofchronickidneydisease(CKD)withnon-alcoholicfattyliverdisease(NAFLD)bybioinformaticsanalysisandmachinelearning”，这篇文章发表在FrontEndocrinol(Lausanne)
7+衰老+WGCNA+机器学习+实验，非肿瘤领域的衰老相关研究生信风暴论文阅读
今天给同学们分享一篇生信文章“Identificationofaging-relatedbiomarkersandimmuneinfiltrationcharacteristicsinosteoarthritisbasedonbioinformaticsanalysisandmachinelearning”，这篇文章发表在FrontImmunol期刊上，影响因子为7.3。结果解读：数据处理作者整合
52.《Bioinformatics Data Skills》之实战：获取基因组基因间区域与内含子区域 DataScience
今天我们通过2个实战来掌握函数gaps，setdiff与reduce在GenomicRanges中的使用：获取基因间区域；获取基因的内含子区域。Gaps函数了解首先了解一下提取基因间区域需要用到的gaps函数，此函数用于返回范围间的空白区域，之前在IRanges包中介绍过。但GRanges对象增加了strand信息，结果有所不同，通过一个简单的例子说明：首先创建一个GRanges对象gr2：>li
bioconda中国镜像(北外备用，清华已恢复，中科大暂时没恢复) zd200572 生物信息 biconda tuna mirror anaconda
bioconda是conda上一个分发生物信息软件的频道，现在已经有超过2700款软件。由于国内没有基镜像，下载安装生物信息软件速度十分缓慢，经常中断，生物信息人迫切需要一个国内镜像。Biocondaisachannelforthecondapackagemanagerspecializinginbioinformaticssoftware。2019.6.15高兴地看到大家相互转告清华源恢复了。1
41.《Bioinformatics Data Skills》之IRanges操作 DataScience
上节内容介绍了IRange对象的创建与提取，它的数据形式虽然类似于dataframe，实际上为IRange对象。这种类别允许进行专门的处理操作，接下面我们学习一下对IRange对象的运算，转换与集合的操作。计算计算包换+，-，*（没有/，因为没有意义）。加法或者减法的作用是在范围的两侧对称地延伸或者缩减特定的长度（图1）：>xx+4LIRangesoflength2startendwidth[1]
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》