久等了,接上一次内容。这次我们要让热图更加复杂化。
实际上,有些情况下做热图可能只需要标注对照组、实验组即可。但是大多时候,可以在热图上体现更多信息,比如,除了分组,还有不同得处理、年龄、性别、疾病阶段等等,以及不同功能基因也要分组。
因此,需要在热图上添加更多分组信息。
下面是我们得示例数据,一个表达举证(数据纯属虚构,分组纯属虚构)
第一步,还是将数据读入,加载R包,这里我们使用pheatmap。
setwd("D:/tq/热图行列注释")
A <- read.csv("行列注释.csv",header = T,row.names = 1)
library(pheatmap)
接下来,写列得注释信息,也就是列的分组。
annotation_col = data.frame(
group = c(rep("ST",3),rep("TZ",3),rep("TL",5),rep("TS",4),rep("TQ",3)),
Stage = c(rep("Stage0", 3), rep("Stage1",8), rep("Stage2", 4), rep("Stage3",3)),
Age = c(rep("30",2),rep("35",2),rep("30",4),rep("45",3),rep("34",3),rep("33",2),rep("31",2)),
Sex = c(rep("F",3),rep("M",3),rep("F",6),rep("M",5),rep("F",1))
)
row.names(annotation_col) <- colnames(A)
理论上,annotation_col可以包含无数个分组信息,只要你有,那么就可以放进去。之后将分组信息与入读得矩阵列名结合。
当然了,如果分组太多,手打不现实,可以先编辑好Excel文件,然后读入。
同理,行的信息注释如下:
annotation_row = data.frame(
Biological_process = c(rep("Immune response",20), rep("Proteoglycans in cancer", 13),
rep("Glycolysis",18),rep("Endocytosis",35)),
Pathway = c(rep("Wnt",20), rep("Inflammatory",32),rep("HIF",34))
)
row.names(annotation_row) <- rownames(A)
画图(用pheatmap函数):
pheatmap(A,cluster_rows = T,cluster_cols = F,
color=colorRampPalette(c("navy","white","firebrick3"))(100),
show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
annotation_col = annotation_col, annotation_row = annotation_row)
发现注释信息已经全部添加上了,效果还不错,但是注释的颜色不太好。这个也是可以个性化实现的,用你喜欢的颜色即可。我们示例几个:
groupcolor <- c("#85B22E","#5F80B4","#E29827","#922927",'#57C3F3')
names(groupcolor) <- c("ST","TZ","TL","TS","TQ") #类型颜色
Agecolor <- colorRampPalette(c("white","#99CCCC","#66CC99","#339966"))(6)
names(Agecolor) <- c("30","31","33","34","35","45")
Sexcolor <- c("red","#016D06")
names(Sexcolor) <- c("F","M") #类型颜色
BPcolor <- c("#708090",'#68A180','#F3B1A0', '#D6E7A3')
names(BPcolor) <- c("Immune response","Proteoglycans in cancer","Glycolysis","Endocytosis")
ann_colors <- list(group=groupcolor, Age= Agecolor, Sex=Sexcolor, Biological_process=BPcolor) #颜色设置
在画图的时候,heatmap函数中多添加annotation_colors即可:
pheatmap(A,cluster_rows = T,cluster_cols = F,
color=colorRampPalette(c("navy","white","firebrick3"))(100),
show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
annotation_col = annotation_col, annotation_row = annotation_row,
annotation_colors = ann_colors)
比默认的颜色好多了。
此外,在pheatmap中也能实现上次Complexheatmap出现的分裂效果,只不过这里是根据聚类分的,不聚类不能分。所以选择使用,按实际情况。
pheatmap(A,cluster_rows = T,cluster_cols = T,
color=colorRampPalette(c("navy","white","firebrick3"))(100),
show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
annotation_col = annotation_col, annotation_row = annotation_row,
annotation_colors = ann_colors,cutree_row = 4, cutree_cols = 5)
这就是行列分组信息注释的内容了,是不是会更长一层楼!
下节热图预告---Complexheatmap函数对热图行列信息注释。
一起学习进步把!