热图3:热图行列分组信息注释

久等了,接上一次内容。这次我们要让热图更加复杂化。

实际上,有些情况下做热图可能只需要标注对照组、实验组即可。但是大多时候,可以在热图上体现更多信息,比如,除了分组,还有不同得处理、年龄、性别、疾病阶段等等,以及不同功能基因也要分组。

因此,需要在热图上添加更多分组信息。

下面是我们得示例数据,一个表达举证(数据纯属虚构,分组纯属虚构)


image.png

第一步,还是将数据读入,加载R包,这里我们使用pheatmap。

setwd("D:/tq/热图行列注释")
A <- read.csv("行列注释.csv",header = T,row.names = 1)
library(pheatmap)

接下来,写列得注释信息,也就是列的分组。

annotation_col = data.frame(
  group = c(rep("ST",3),rep("TZ",3),rep("TL",5),rep("TS",4),rep("TQ",3)),
  Stage = c(rep("Stage0", 3), rep("Stage1",8), rep("Stage2", 4), rep("Stage3",3)),
  Age = c(rep("30",2),rep("35",2),rep("30",4),rep("45",3),rep("34",3),rep("33",2),rep("31",2)),
  Sex = c(rep("F",3),rep("M",3),rep("F",6),rep("M",5),rep("F",1))
)
row.names(annotation_col) <- colnames(A)

理论上,annotation_col可以包含无数个分组信息,只要你有,那么就可以放进去。之后将分组信息与入读得矩阵列名结合。


image.png

当然了,如果分组太多,手打不现实,可以先编辑好Excel文件,然后读入。
同理,行的信息注释如下:

annotation_row = data.frame(
  Biological_process = c(rep("Immune response",20), rep("Proteoglycans in cancer", 13),
              rep("Glycolysis",18),rep("Endocytosis",35)),
  Pathway = c(rep("Wnt",20), rep("Inflammatory",32),rep("HIF",34))
)
row.names(annotation_row) <- rownames(A)

画图(用pheatmap函数):

pheatmap(A,cluster_rows = T,cluster_cols = F,
         color=colorRampPalette(c("navy","white","firebrick3"))(100),
         show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
         annotation_col = annotation_col, annotation_row = annotation_row)
image.png

发现注释信息已经全部添加上了,效果还不错,但是注释的颜色不太好。这个也是可以个性化实现的,用你喜欢的颜色即可。我们示例几个:

groupcolor <- c("#85B22E","#5F80B4","#E29827","#922927",'#57C3F3') 
names(groupcolor) <- c("ST","TZ","TL","TS","TQ") #类型颜色

Agecolor <- colorRampPalette(c("white","#99CCCC","#66CC99","#339966"))(6)
names(Agecolor) <- c("30","31","33","34","35","45")

Sexcolor <- c("red","#016D06") 
names(Sexcolor) <- c("F","M") #类型颜色

BPcolor <- c("#708090",'#68A180','#F3B1A0', '#D6E7A3')
names(BPcolor) <- c("Immune response","Proteoglycans in cancer","Glycolysis","Endocytosis")

ann_colors <- list(group=groupcolor, Age= Agecolor, Sex=Sexcolor, Biological_process=BPcolor) #颜色设置

在画图的时候,heatmap函数中多添加annotation_colors即可:

pheatmap(A,cluster_rows = T,cluster_cols = F,
         color=colorRampPalette(c("navy","white","firebrick3"))(100),
         show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
         annotation_col = annotation_col, annotation_row = annotation_row,
         annotation_colors = ann_colors)
image.png

比默认的颜色好多了。
此外,在pheatmap中也能实现上次Complexheatmap出现的分裂效果,只不过这里是根据聚类分的,不聚类不能分。所以选择使用,按实际情况。

pheatmap(A,cluster_rows = T,cluster_cols = T,
         color=colorRampPalette(c("navy","white","firebrick3"))(100),
         show_colnames = T,border_color = NA,scale = "row",show_rownames =F,
         annotation_col = annotation_col, annotation_row = annotation_row,
         annotation_colors = ann_colors,cutree_row = 4, cutree_cols = 5)
image.png

这就是行列分组信息注释的内容了,是不是会更长一层楼!
下节热图预告---Complexheatmap函数对热图行列信息注释。
一起学习进步把!

你可能感兴趣的:(热图3:热图行列分组信息注释)