11.5-9 RNA-seq 数据差异基因的得到和可视化学习(一)

很倒霉,电脑坏了。之前未完成的rna-seq数据下载和mcscan不能继续进行了。

最近要在网上直接下载rna-seq的txt数据,所以主要学习一下如何挑选出差异基因,之后进行可视化。

https://www.jianshu.com/p/3a0e1e3e41d0

1、挑选出差异基因。

This tutorial shows an example of RNA-seq data analysis with DESeq2, followed by KEGG pathway analysis using GAGE.:

http://www.gettinggeneticsdone.com/2015/12/tutorial-rna-seq-differential.html

2、可视化

由于我们的下载数据是rpkm。所以我们直接log2 transform。

https://www.jianshu.com/p/807cf4a969fb

1、MA plot

在DESeq2中,函数plotMA显示了一个给定变量对DESeqDataSet中所有样本的归一化计数均值的log2倍变化。如果调整后的p值小于0.1,点会被涂成红色。从窗口掉下来的点被画成向上或向下的开放三角形。

wikipedia 公式

https://en.wikipedia.org/wiki/MA_plot

Several Bioconductor packages, for the R software, provide the facility for creating MA plots. These include affy (ma.plot, mva.pairs), limma (plotMA), marray (maPlot), and edgeR(maPlot)

2、Plot counts

DESeq2提供了一个plotCounts()函数来查看某一个感兴趣的gene在组间的差别。

?plotCounts()来看如何使用

3、热图

我们主要根据https://www.jianshu.com/p/398115d2d2e8来学习

heatmap():用于绘制简单热图的函数

heatmap.2():绘制增强热图的函数

d3heatmap:用于绘制交互式热图的R包

ComplexHeatmap:用于绘制、注释和排列复杂热图的R&bioconductor包(非常适用于基因组数据分析)

1、首先,最简单的热图

将id作为列名

使用as.matrix不可以将list转化为矩阵,所以:

转化为数值矩阵

usetest<-matrix(unlist(test),6,14)

 heatmap(usetest,scale="column")得到

这里的数字是可以用rowname和colname语句换成想要的。

简单换颜色,可以加上一句  

col <- colorRampPalette(c("red", "white", "blue"))(256)  在heatmap前

2、增强版

gplots中的heatmap.2

heatmap.2(usetest,scale="column",col=bluered(20),trace = "none",density.info = "none")

heatmap


对于文本大小的调节:

https://www.plob.org/article/10045.html/comment-page-1/

heatmap.2(x, srtCol=0, adjCol = c(0.5,1) )

heatmap.2(x, srtCol=45, adjCol = c(1,1) )。。。。。等

这篇文章还讲了如何运用多种聚类的方法。

今天又画了一次热图

baifen<-read.csv("baifen.csv",header=T)

rownames(baifen)<-baifen[,1]

baifen<-baifen[,-1]

mabaifen<-as.matrix(scale(baifen))

heatmap.2(mabaifen, keysize=1.5,key.title = NA,col=colorRampPalette(c("green","white","red")),scale="none",trace = "none",dendrogram="none",Colv = FALSE,cexCol=1,cexRow=0.8)

你可能感兴趣的:(11.5-9 RNA-seq 数据差异基因的得到和可视化学习(一))