数学建模:4.相关系数

(以下有个人在学习过程中的理解,可能会有所偏差)

一、

最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小。

二、皮尔逊Pearson相关系数的使用方法

1.画散点图,查看数据之间有无相关性

2、进行正态分布检验

分为::雅克‐贝拉检验(Jarque‐Bera test) :JB检验(大样本 n>30)

Shapiro‐wilk夏皮洛‐威尔克检验:小样本3≤n≤50

Q-Q图:要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点
是否近似地在一条直线附近。(要求数据量非常大)

3.如果上面都通过了,则计算各列之间的相关系数以及p值(显著性检验),之后 在EXCEL表格中给数据右上角标上显著性符号。(P < 0.01 % 标记3颗星的位置,(P < 0.05) .* (P > 0.01) % 标记2颗星的位置,(P < 0.1) .* (P > 0.05) % 标记1颗星的位置)

4.没通过,则采用斯皮尔曼spearman等级相关系数

三、斯皮尔曼spearman等级相关系数

有两种定义方法:

第一种

数学建模:4.相关系数_第1张图片

第二种

斯皮尔曼相关系数被定义成等级之间的皮尔逊相关系数。

Matlab使用的是第二种计算方法

应用步骤:

1.计算其相关系数

数学建模:4.相关系数_第2张图片

2.进行相关系数的假设检验(显著性检验)

小样本情况,即 <=时,直接查临界值表即可。 

数学建模:4.相关系数_第3张图片

3.之后 在EXCEL表格中给数据右上角标上显著性符号。

四、注意事项

数学建模:4.相关系数_第4张图片

 仅记录自己在学习过程中的心得与体会

 

你可能感兴趣的:(数学建模,大数据)