R_Studio(学生成绩)数据相关性分析

 

 

  对“Gary.csv”中的成绩数据进行统计量分析

  R_Studio(学生成绩)数据相关性分析_第1张图片

 

  R_Studio(学生成绩)数据相关性分析_第2张图片

    

  用cor函数来计算相关性,method默认参数是用pearson;并且遇到缺失值,use默认参数everything,结果会是NA

 

相关性分析

  当值r>1时,正相关,一个变量增加或减少时,另一个变量也相应增加或减少

  当值r=1时,无相关,说明两个变量相互独立,有一个变量值无法预测另一个变量值

  当值r<1时,负相关,一个变量增加或减少时,另一个变量也相应减少或增加

 

  相关系数取值范围限于: -1 <= r <= +1

 

R_Studio(学生成绩)数据相关性分析_第3张图片

 

R_Studio(学生成绩)数据相关性分析_第4张图片

 

  好严格的对称性

  如果只想看大学体育和大学英语 相关性系数

  小case!

R_Studio(学生成绩)数据相关性分析_第5张图片

 

 

setwd('D:\\data')                            #更改工作目录
list.files()                                #列出当前工作目录下的文件
dat=read.csv(file="Gary.csv",header=TRUE) 

cor(dat)

plot(dat)

#大学体育 大学英语 相关性系数
cor(dat[,1],dat[,2])

#绘图
plot(dat[,1],dat[,2])
Gary.R

 

 

 可视化相关性分析  传送门

  [1] 使用 symnum() 函数实现可视化

  [2] 使用 corrplot() 函数实现可视化

  [3] 使用 PerformanceAnalytics 包进行可视化

  [4] heatmap 可视化

 

转载于:https://www.cnblogs.com/1138720556Gary/p/9652124.html

你可能感兴趣的:(R_Studio(学生成绩)数据相关性分析)