DESeq分析基因的差异表达以及安装中出现的问题

DESeq采用NB(负二项分布检验的方式)对reads数进行差异显著性检验,同时还增加了矫正由于长度引起的误差,估算基因表达量的方式采用basemean值来估算表达量(标准化以后)这里,我在R下安装DESeq包出现了一些问题帮助总结一下。

首先,我的R是15.0版本

打开R
source("http://bioconductor.org/biocLite.R")
biocLite(‘DEseq’)
会出现安装成功
loading的时候缺少locfit包则需要再输入(locfit包只在15.1版本下编译的,不过貌似没什么问题)
biocLite(‘locfit’)
再loading会出现缺少xtable包
输入
biocLite(‘xtable’)
在loading会出现XML报错
输入
biocLite(‘XML’)
这样DESeq就运行没有问题了。

注中间可能会出现某个包无法安装的情况,注意检查网络连接


下面具体的如何进行差异显著性检验,我参考别人的数据,这里计算出reads在每个样本中各个基因上的counts数文件,下面couns_...分别表示6个样本(三个重复对照三个重复处理组)

         library(DESeq)

        setwd("wherethe data is")

        #设置工作路径,可以再GUI上面直接设置

        c1<-read.table("counts_074284",row.names=1)

        c2<-read.table("counts_074286",row.names=1)

        c3<-read.table("counts_074262",row.names=1)

        c4<-read.table("counts_074263",row.names=1)

        c5<-read.table("counts_074264",row.names=1)

        c6<-read.table("counts_074285",row.names=1)

        #读入几组counts数据

        counts<-cbind(c1,c2,c3,c4,c5,c6)

        counts<-counts[-c(32679:32683),]  #remove the more general lines

        colnames(counts)<-c("P1","P2","P3","M1","M2","M3")

        #讲数据放到表中

        design<- rep (c("P","Mo"),each=3)

        #描述实验设置重复

          de  <- newCountDataSet(counts, design)

        #de  <- estimateSizeFactors(de)

        de  <-  estimateDispersions(de)

        de<- estimateDispersions(de)

        res  <- nbinomTest(de,"P","Mo")

        #计算结果

         sum(na.omit(res$padj<0.05))

        #输出差异显著的值。
#最后再加一部把数据输出出来,这个我就不用说了
    write.table(res,file="file.csv",sep=",")

你可能感兴趣的:(c,xml,工作,File,each,library)