统计学三大相关系数之肯德尔(kendall)相关性系数

肯德尔相关性系数,又称肯德尔秩相关系数,它也是一种秩相关系数,不过它所计算的对象是分类变量。

分类变量可以理解成有类别的变量,可以分为

无序的,比如性别(男、女)、血型(A、B、O、AB);

有序的,比如肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)。

通常需要求相关性系数的都是有序分类变量。

 

举个例子。比如评委对选手的评分(优、中、差等),我们想看两个(或者多个)评委对几位选手的评价标准是否一致;或者医院的尿糖化验报告,想检验各个医院对尿糖的化验结果是否一致,这时候就可以使用肯德尔相关性系数进行衡量。

维基百科肯德尔相关性系数的计算公式:

  

R语言:ndarray 变量的相关系数矩阵

import numpy as np
vc=[1,2,39,0,8]
vb=[1,2,38,0,8]
print(np.mean(np.multiply((vc-np.mean(vc)),(vb-np.mean(vb))))/(np.std(vb)*np.std(vc)))
#corrcoef得到相关系数矩阵(向量的相似程度)
print(np.corrcoef(vc,vb))

计算结果为:-0.2611165

这时候就可以理解为两位老师对选手们的看法是呈相反趋势的,不过这种相反的程度不很大

参考:http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html

https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

你可能感兴趣的:(统计学)