皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数

给定两个连续变量x和y,皮尔森相关系数被定义为:

皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数_第1张图片

————————————————————————————————————————————————

由于原则上无法准确定义顺序变量各类别之间的距离,导致计算出来的相关系数不是变量间的关联性的真实表示。因此,建议对顺序变量使用斯皮尔曼相关系数。

斯皮尔曼相关系数的计算采用的是取值的等级,而不是取值本身。例如,给定三个值:33,21,44,它们的等级就分别是2,1,3.  计算斯皮尔曼相关系数的公式与计算皮尔森相关系数的类似,但用等级代替了各自的取值。

皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数_第2张图片

相对于皮尔森相关系数,斯皮尔曼相关系数对于数据错误和极端值的反应不敏感。

斯皮尔曼相关系数的另一种公式表示如下:

皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数_第3张图片


参考文献:Mamdouh Refaat, 信用风险评分卡研究——基于SAS的开发与实施

你可能感兴趣的:(统计基础)