DESeq采用NB(负二项分布检验的方式)对reads数进行差异显著性检验,同时还增加了矫正由于长度引起的误差,估算基因表达量的方式采用basemean值来估算表达量(标准化以后)这里,我在R下安装DESeq包出现了一些问题帮助总结一下。
首先,我的R是15.0版本
注中间可能会出现某个包无法安装的情况,注意检查网络连接
下面具体的如何进行差异显著性检验,我参考别人的数据,这里计算出reads在每个样本中各个基因上的counts数文件,下面couns_...分别表示6个样本(三个重复对照三个重复处理组)
library(DESeq)
setwd("wherethe data is")
#设置工作路径,可以再GUI上面直接设置
c1<-read.table("counts_074284",row.names=1)
c2<-read.table("counts_074286",row.names=1)
c3<-read.table("counts_074262",row.names=1)
c4<-read.table("counts_074263",row.names=1)
c5<-read.table("counts_074264",row.names=1)
c6<-read.table("counts_074285",row.names=1)
#读入几组counts数据
counts<-cbind(c1,c2,c3,c4,c5,c6)
counts<-counts[-c(32679:32683),] #remove the more general lines
colnames(counts)<-c("P1","P2","P3","M1","M2","M3")
#讲数据放到表中
design<- rep (c("P","Mo"),each=3)
#描述实验设置重复
de <- newCountDataSet(counts, design)
#de <- estimateSizeFactors(de)
de <- estimateDispersions(de)
de<- estimateDispersions(de)
res <- nbinomTest(de,"P","Mo")
#计算结果
sum(na.omit(res$padj<0.05))
#输出差异显著的值。
#最后再加一部把数据输出出来,这个我就不用说了
write.table(res,file="file.csv",sep=",")