R语言相关系数的可视化

R语言corrplot包中的corrplot()函数,提供了一整套对相关系数可视化的包,可很容易就将文字结果转化为图片,使您的报告更加光彩夺目,颜值瞬间上升几个档次。ggplot2是R语言可视化大杀器,自带的mtcars数据集收录了32辆汽车在11个指标上的数据。下面就以mtcars为例,讲解相关系数的可视化。


01

相关系数的计算

#在计算之前,首先安装两个安装包

install.packages("ggplot2")

install.packages("corrplot")

#加载安装包

library(ggplot2)

library(corrpolt)

#查看数据集

mtcars

图2 mtcars数据集基本情况


变量数较多,为了方便讲解,接下来我们只使用前5个变量进行相关性分析。

#计算前5个变量的相关系数

corr <- cor(mtcars[,1:5])

#查看相关系数

corr

图3 计算得到的相关系数矩阵


02

相关系数的可视化

#参数全部默认情况下的相关系数图

corrplot(corr = corr)

图4 默认情况下可视化结果

从结果可以看出,默认情况下的输出简单粗暴,只能通过颜色和大小看出大概的情况,并不能看出相关系数的具体数值。下面通过参数改变参数进行调节。

#指定数值方法的相关系数图

图5 文字结果可视化



结果为文字转化为图片而已,和SPSS输出没有多少差别,如果将两者结合起来,可能效果会更好。

#两者结合起来,看看效果

图6 两组结合可视化


相对好了很多,但是,这种方式下,有可能图片颜色覆盖了数值,是具体值难以辨认,我们发现,以对角线为届,两边的数值是对称的。如果将一般设置为数值,一般设置为图片,可能效果会好一些。

#首先画出右上部分图形

corrplot(corr = corr,order="AOE",type="upper",tl.pos="tp")

#再添加左下部分的数值

corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE", col="black",diag=FALSE,tl.pos="n", cl.pos="n")

图7 调整结果



转载自:http://www.pinlue.com/article/2017/07/0518/443213523721.html


相关链接:

http://blog.sina.com.cn/s/blog_73b6c16e0102uw6n.html

https://rpubs.com/loness/183681

https://cosx.org/2009/03/correlation-matrix-visualization/

你可能感兴趣的:(Statistics,and,R)