KAPPA statistic

第一次注意到这个参数的时候,很奇怪为什么衣服的品牌名会出现在这里,经过查阅后知道不是,不过这个东东是什么也没怎么弄懂,今天好好看看。

Kappa,用于评估新技术或测试产生的差异是技术还是观测者带来的。Kappa,广泛用于评测观察者之间的差异,即几个观察者产生相同判断的频数。简单的用yes和no的比例还评测不“科学”,因为这样没有考虑偶然性。当然,KAPPA考虑了。

关于方程,我截个图,大家应该能很容易的看懂。同时附一个同意比例的意义一图。

imageimage

基于这个图我们可以看到,kappa由agreement,prevalence,bias这三个指数影响。

prevalence(base rate)

基准率,原文是关于胸透的所以用的prevalence这个词。

由上图的式子可以看出,prevalence的含义。prevalence与Kappa成反比。Prevalence在-1和+1之间徘徊,is 0 when + and – responses are equally probable.(a和d的个数相等,应该是这个意思,但这句话我不会翻,搞不懂)

Bias index(偏见)

从上图也能看出bias的含义。bias与kappa成反比。bias在0到1之间徘徊,当没有bias是为0。

上面说的大多数都是废话,有用的主要是kappa的介绍。

The kappa statistic measures the agreement of prediction with the true class -- 1.0 signifies complete agreement.

这句是WEKA对KAPPA这一数值的解释。根据Confusion Matrix使用上图中的公式计算KAPPA。

你可能感兴趣的:(KAPPA statistic)