生信人R语言

09. 任意基因任意癌症表达量和临床性状关联

#视频中的代码
rm(list = ls())
options(stringsAsFactors = F)
#Ovarian serous Cystadenocarcinoma(TCGA,Nature 2011)
#All complete Tumors (316 samples)/1 Genes
#Gene Set/Pathway is altered in 28 (8.9%) of queried samples
a = read.table('plot-data-ARHGAP18-TCGA-OV-cbioportal.txt',header = T, sep = '\t', fill = T)
colnames(a) = c('id','stage','gene','mut')
dat = a
library(BiocManager)
BiocManager::install("metaBMA")

library(ggstatsplot)

ggbetweenstats(data = dat,x=stage,y = gene)
library(ggplot2)
ggsave('plot-data-ARHGAP18-TCGA-OV-cbioportal.png')

10. 表达矩阵的样本相关性

load("D:/Soft/airway_exprSet.Rdata")
dim(exprSet)#查看样本维度;8个维度,六万多个样本

c36cfe332dcb4e878b78ad5007c9b895.png

#cor函数验证样本之间的相关性;接近于1,则相关性越高
cor(exprSet[,1],exprSet[,2])#取表格的第一列和第二列
cor(exprSet)

e6d45d4edd9b4c13bfd045cf7ffc90ec.png

生信人R语言_第1张图片

#根据相关性作图
pheatmap::pheatmap(cor(exprSet))

生信人R语言_第2张图片

 

#把矩阵取小
x=exprSet[1,]
x>1#返回值为T或F
sum(x>1)
x=exprSet[2,]
x>1#返回值为T或F
sum(x>1)>5#基因表达量为大于5则符合要求
apply(exprSet,1,function(x) sum(x>1)>5)
dim(exprSet)#查看样本维度1
exprSet=exprSet[apply(exprSet,1,function(x) sum(x>1)>5),]
dim(exprSet)#查看样本维度2

生信人R语言_第3张图片

生信人R语言_第4张图片

dcb9b678fac14145819a4542ff2a5406.png

#查看已安装的R包
#安装edgeR
#colnames(installed.packages())
#install.packages('BiocManager')
BiocManager::install('edgeR')
exprSet=log(edgeR::cpm(exprSet)+1)
exprSet=exprSet[names(sort(apply(exprSet,1,mad),decreasing = T)[1:500]),]
dim(exprSet)

6d34630ef3fb44d89505e2edee6fbde4.png

M=cor(log2(exprSet+1))
pheatmap::pheatmap(M)
dev.off()#关闭画板

生信人R语言_第5张图片

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(r语言,开发语言)