(以下有个人在学习过程中的理解,可能会有所偏差)
一、
最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小。
二、皮尔逊Pearson相关系数的使用方法
1.画散点图,查看数据之间有无相关性
2、进行正态分布检验
分为::雅克‐贝拉检验(Jarque‐Bera test) :JB检验(大样本 n>30)
Shapiro‐wilk夏皮洛‐威尔克检验:小样本3≤n≤50
Q-Q图:要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点
是否近似地在一条直线附近。(要求数据量非常大)
3.如果上面都通过了,则计算各列之间的相关系数以及p值(显著性检验),之后 在EXCEL表格中给数据右上角标上显著性符号。(P < 0.01 % 标记3颗星的位置,(P < 0.05) .* (P > 0.01) % 标记2颗星的位置,(P < 0.1) .* (P > 0.05) % 标记1颗星的位置)
4.没通过,则采用斯皮尔曼spearman等级相关系数
三、斯皮尔曼spearman等级相关系数
有两种定义方法:
第一种
第二种
斯皮尔曼相关系数被定义成等级之间的皮尔逊相关系数。
Matlab使用的是第二种计算方法
应用步骤:
1.计算其相关系数
2.进行相关系数的假设检验(显著性检验)
小样本情况,即 <=时,直接查临界值表即可。
3.之后 在EXCEL表格中给数据右上角标上显著性符号。
四、注意事项
仅记录自己在学习过程中的心得与体会