TCGA数据 ENSG编号转为Symbol(基因名称)

当想查看对应的差异基因对应的Symbol(基因名称)的时候,发现基因为编码为ENSG开头的一串数字,Ensembl基因的ID

# 安装包

source("https://bioconductor.org/biocLite.R")

biocLite("AnnotationDbi")

biocLite("org.Hs.eg.db")

# 加载包

library(stats4)
library(BiocGenerics)
library(parallel)

library("AnnotationDbi")

library("org.Hs.eg.db")

# for test

GENEID <- c(1,2,3,9,10)

ENSEMBL <- c("ENSG00000000003","ENSG00000075218","ENSG00000256069","ENSG00000171428","ENSG00000156006")

df <- data.frame(ENSEMBL,GENEID)

# ENSG转换Symbol

df$symbol <- mapIds(org.Hs.eg.db,keys=ENSEMBL,column="SYMBOL",keytype="ENSEMBL",multiVals="first")

你可能感兴趣的:(R)