初步接触数据集,探索性分析后,经常需要做一个相关分析,得到各变量间的相关系数以及显著性水平。
本文介绍一下R-corrplot包进行相关可视化展示。
一 数据准备
载入所需的R包,利用公共数据集mtcars进行展示。
library(corrplot)
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
#计算变量之间的相关系数
corr <- cor(mtcars)
二 相关系数展示
2.1 默认参数展示
corrplot(corr)
2.2 更该形状和显示范围
method,:指定形状,可以是circle圆形(默认),square方形, ellipse, 椭圆形,number数值,shade阴影,color颜色,pie饼图。
type:指定显示范围,full完全(默认),lower下三角,upper上三角。
corrplot(mat_cor, method = "number", type = "upper", title = "")
corrplot(mat_cor, method = "pie", type = "lower", title = "下三角",mar = c(1,1,1,1))
2.3 更改颜色
可以使用自定义颜色或者brewer.pal函数的画板。
corrplot(corr, method = "ellipse", col = colorRampPalette(c("red", "blue"))(10), title = "更改颜色")
corrplot(corr, method = "number", col = RColorBrewer::brewer.pal(n=11, name = "RdYlGn"),title = "")
2.4 排序和聚类
order,:指定相关系数排序的方法, original原始顺序,AOE特征向量角序,FPC第一主成分顺序,hclust层次聚类顺序,alphabet字母顺序。
hclust.method:order参数为hclust时可指定hclust中方法,7种可选:complete, ward, single, average, mcquitty, median和centroid。
addrect:指定order参数为hclust时有效, 是否添加矩形框, 默认不添加, 用整数指定即可添加。
corrplot(corr,method="color",order="hclust",title = "hclust聚类", diag = TRUE,hclust.method="average",addCoef.col = "blue")
2.5 组合展示
corrplot(corr, method = "circle", type = "upper", tl.pos = "d")
corrplot(corr, add = TRUE, type = "lower", method = "number", diag = FALSE, tl.pos = "n", cl.pos = "n")
NOW,corrplot进行相关性的可视化就简单介绍到这,可以根据自己的审美组合图形,颜色等。
更多关于生信,R,Python的内容请扫码关注小号,谢谢。