很倒霉,电脑坏了。之前未完成的rna-seq数据下载和mcscan不能继续进行了。
最近要在网上直接下载rna-seq的txt数据,所以主要学习一下如何挑选出差异基因,之后进行可视化。
https://www.jianshu.com/p/3a0e1e3e41d0
1、挑选出差异基因。
This tutorial shows an example of RNA-seq data analysis with DESeq2, followed by KEGG pathway analysis using GAGE.:
http://www.gettinggeneticsdone.com/2015/12/tutorial-rna-seq-differential.html
2、可视化
由于我们的下载数据是rpkm。所以我们直接log2 transform。
https://www.jianshu.com/p/807cf4a969fb
1、MA plot
在DESeq2中,函数plotMA显示了一个给定变量对DESeqDataSet中所有样本的归一化计数均值的log2倍变化。如果调整后的p值小于0.1,点会被涂成红色。从窗口掉下来的点被画成向上或向下的开放三角形。
https://en.wikipedia.org/wiki/MA_plot
Several Bioconductor packages, for the R software, provide the facility for creating MA plots. These include affy (ma.plot, mva.pairs), limma (plotMA), marray (maPlot), and edgeR(maPlot)
2、Plot counts
DESeq2提供了一个plotCounts()函数来查看某一个感兴趣的gene在组间的差别。
?plotCounts()来看如何使用
3、热图
我们主要根据https://www.jianshu.com/p/398115d2d2e8来学习
heatmap():用于绘制简单热图的函数
heatmap.2():绘制增强热图的函数
d3heatmap:用于绘制交互式热图的R包
ComplexHeatmap:用于绘制、注释和排列复杂热图的R&bioconductor包(非常适用于基因组数据分析)
1、首先,最简单的热图
使用as.matrix不可以将list转化为矩阵,所以:
usetest<-matrix(unlist(test),6,14)
这里的数字是可以用rowname和colname语句换成想要的。
简单换颜色,可以加上一句
col <- colorRampPalette(c("red", "white", "blue"))(256) 在heatmap前
2、增强版
gplots中的heatmap.2
heatmap.2(usetest,scale="column",col=bluered(20),trace = "none",density.info = "none")
对于文本大小的调节:
https://www.plob.org/article/10045.html/comment-page-1/
heatmap.2(x, srtCol=0, adjCol = c(0.5,1) )
heatmap.2(x, srtCol=45, adjCol = c(1,1) )。。。。。等
这篇文章还讲了如何运用多种聚类的方法。
今天又画了一次热图
baifen<-read.csv("baifen.csv",header=T)
rownames(baifen)<-baifen[,1]
baifen<-baifen[,-1]
mabaifen<-as.matrix(scale(baifen))
heatmap.2(mabaifen, keysize=1.5,key.title = NA,col=colorRampPalette(c("green","white","red")),scale="none",trace = "none",dendrogram="none",Colv = FALSE,cexCol=1,cexRow=0.8)