转换基因名称

转换基因名称

library(org.Mm.eg.db)

library(“clusterProfiler”)

gas<-read.csv(‘C:/Users/Administrator/Desktop/ts11/gas9.csv’)

gene.df <- bitr(gas$gene, fromType = “ENSEMBL”, #fromType是指你的数据ID类型是属于哪一类的
toType = c(“SYMBOL”), #toType是指你要转换成哪种ID类型,可以写多种,也可以只写一种
OrgDb = org.Mm.eg.db)#Orgdb是指对应的注释包是哪个

mer=merge(x=gas, y=gene.df, by.x=“gene”, by.y=“ENSEMBL”, all.x=TRUE, all.y=FALSE)
dim(mer)

df3 <- mer
df5 <- aggregate(df3[41], df3[-41], FUN = function(X) paste(unique(X), collapse=","))###加入有NA字段的行被删除,所以sed -i ‘s/NA/NAiiiiiii/g’ * 再替换回去
dim(df5)

write.csv(df5,‘C:/Users/Administrator/Desktop/tss/gas9.csv’)

https://www.jianshu.com/p/da6ff8acac83

我们可以根据以下命令进行实现

df1 <- aggregate(df[7], df[-7], unique)

或者

df2 <- aggregate(df[7], df[-7], FUN = function(X) paste(unique(X), collapse=", "))

R将包含重复列的去重并合并值 - 简书 https://www.jianshu.com/p/da6ff8acac83

你可能感兴趣的:(Linux,R)