用R做GO功能注释和KEGG通路富集分析

KEGG -GO主要是使用R 中clusterProfiler包进行富集分析  以及使用pathview 包进行代谢途径整合和可视化。

进行在线分析的:https://pathways.embl.de/

1.代码:https://github.com/Cassiel60/R/blob/master/enrichment.r

2.安装包:使用代码中的方法要多尝试几次,反正我第一次安装时就是安装了很久。详细:http://www.bioconductor.org/packages/release/bioc/html/clusterProfiler.html  

3.gene.list 是一列包含基因和标题的文件

data <- read.table("gene.list",header=TRUE)

4.GO、KEGG富集分析-DAVID与KOBAS在线分析工具,虽然在线分析有基因个数的限制,但是下载到本地进行,KOBAS的下载需要很多配置软件,一个个安装需要很多时间,所以使用R包进行分析就方便很多。

DAVID:也可以做GO与KEGG富集分析,但是 KOBAS画出的图更好看,但KOBAS不支持直接输入gene symbol ,所以我们常常联合使用DAVID和KOBAS。

5. GO_BP,GO_CC,GO_MF :Gene Ontology 数据库注释库,GO是基因本体学注释,包括了基因的生物学过程(Biological Process,BP),细胞组分(Cellular Component,CC)和分子功能(Molecular Function,MF)的注释,给出变异位点所在蛋白质或者基因参与的生物学通路名称。

6.KEGG_PATHWAY:全基因组及代谢途径数据库注释,给出变异位点所在基因参与的代谢通路名称。

 

你可能感兴趣的:(生物信息分析,R,回顾)