应用genefu对自定义数据集进行PAM50分型

网络上几乎没有教材,很无奈,使用异常艰难,加之作者本身写的软件用法也很复杂,学界实在缺乏工匠精神,很少考虑用户体验,没办法了,只能自己一点一点啃了。

##表达矩阵
ddata<-eset##准备好col为symbol的表达矩阵
##
s<-colnames(ddata)##提取基因名
##id 转换
library(org.Hs.eg.db)
s2g=toTable(org.Hs.egSYMBOL)
g=s2g[match(s,s2g$symbol),1];
head(g)
##构造注释文件
#  probe Gene.symbol Gene.ID
dannot=data.frame(probe=s,
                  "Gene.Symbol" =s, 
                  "EntrezGene.ID"=g)
dannot[1:3,1:3]
##保留已注释的基因及注释文件
ddata=ddata[,!is.na(dannot$EntrezGene.ID)]
dannot=dannot[!is.na(dannot$EntrezGene.ID),] 
head(dannot)

##使用genefu包进行分子分型
library(genefu)
# c("scmgene", "scmod1", "scmod2","pam50", "ssp2006", "ssp2003", "intClust", "AIMS","claudinLow")

s<-molecular.subtyping(sbt.model = "pam50",data=ddata,
                       annot=dannot,do.mapping=TRUE)
str(s)
table(s$subtype)
##将分型结果保存到数据框
tmp=as.data.frame(s$subtype)
tmp
subtypes=as.character(s$subtype)

注:本文代码参考于生信技能树。(仅作记录使用)

你可能感兴趣的:(应用genefu对自定义数据集进行PAM50分型)