R进行相关性分析

一、相关性矩阵计算:

[1] 加载数据:
  data = read.csv(“231-6057_2016-04-05-ZX_WD_2.csv”,header=FALSE)
说明:csv格式的数据,header=FALSE 表示没有标题,即数据从第一行开始。
[2] 计算相关性矩阵(可以自己指定采用的方法,“pearson”, “kendall”, “spearman”)
注:cor(x,y,method = c(“pearson”, “kendall”, “spearman”))
  cor_matr = cor(data)
  cor_matr

二 相关系数的显著性水平(Correlation significance levels (p-value))

使用Hmisc 包,不仅可以计算相关性矩阵,还可以计算对应的显著性水平
[1] 安装包 Hmisc (依赖包也会一并安装,lib代表安装包的路径)
  install.packages(“Hmisc”,lib=“E:/Program Files/R/R-3.3.0/library/”)
[2] 加载包
  library(Hmisc)
[3] 计算相关性和显著水平 (as.matrix(data) 表示将data转换成矩阵)
  rcorr(as.matrix(data))
输出说明:
r :第一个矩阵为相关性矩阵
n : 处理数据的总记录数(行数)
P : 显著性水平矩阵(越小说明越显著)

三、可视化相关性分析

[1] 使用 symnum() 函数实现可视化 (cor_matr 是我们上文中cor()函数计算出来的相关性矩阵)
symnum(cor_matr)
符号说明:在输出的最后一行,说明了符号的意义,例如 [0.9 , 0.95) 这个区间使用 * 表示。其他符号类似
[2] 使用 corrplo

你可能感兴趣的:(R与数据分析)