2020-12-04

自己的代码记录
illunima 芯片数据注释(ID转换):

##ID 转换
library(idmap1)
ids=getIDs('GPL10558')
head(ids)

probe2symbol = ids[,1:2]
head(probe2symbol)
colnames(probe2symbol) <- c("probeset","symbol")
library(dplyr)
library(tibble)
exprSet <- data.frame(exprSet) %>% 
  rownames_to_column(var="probeset") %>% 
  #合并探针的信息
  inner_join(probe2symbol,by="probeset") %>% 
  #去掉多余信息
  select(-probeset) %>% 
  #重新排列
  select(symbol,everything()) %>% 
  #求出平均数(这边的点号代表上一步产出的数据)
  mutate(rowMean =rowMeans(.[grep("GSM", names(.))])) %>% 
  #去除symbol中的NA
  filter(symbol != "NA") %>% 
  #把表达量的平均值按从大到小排序
  arrange(desc(rowMean)) %>% 
  # symbol留下第一个
  distinct(symbol,.keep_all = T) %>% 
  #反向选择去除rowMean这一列
  select(-rowMean) %>% 
  # 列名变成行名
  column_to_rownames(var = "symbol")


save(exprSet,pdata,file = "GSE130404.Rdata")

你可能感兴趣的:(2020-12-04)