使用Weka进行数据挖掘(Weka教程八)Weka分类评价Evaluation输出分析

上一篇讲解了分类模型的构建方法和评价,Weka提供了多种多样的评价指标,为了让大家更清楚,降低学习时间,在这篇文章中我将分析这些指标,首先看下Weka输出的评价结果:
使用Weka进行数据挖掘(Weka教程八)Weka分类评价Evaluation输出分析_第1张图片

这么多评价指标,相信大家肯定头都大了,下面就这些指标一一展开说明:

  • 基本指标

首先是分类中最经典的TPFN组合,如下图所示:
这里写图片描述
1、 FN:False Negative,被判定为负样本,但事实上是正样本。
2、 FP:False Positive,被判定为正样本,但事实上是负样本。
3、TN:True Negative,被判定为负样本,事实上也是负样本。
4、TP:True Positive,被判定为正样本,事实上也是证样本。

5、precesion:查准率
即在检索后返回的结果中,真正正确的个数占整个结果的比例。precesion = TP/(TP+FP) 。
6、 recall:查全率
即在检索结果中真正正确的个数 占整个数据集(检索到的和未检索到的)中真正正确个数的比例。recall = TP/(TP+FN)即,检索结果中,你判断为正的样本也确实为正的,以及那些没在检索结果中被你判断为负但是事实上是正的(FN)。
7、F-Measure
是Precision和Recall加权调和平均
P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Measure(又称为F-Score)。
8、MCC 马修斯相关系数
衡量不平衡数据集的指标比较好,公式是:

这里写图片描述

接下来就是最为著名的ROC曲线了,有必要专门介绍一下。

  • ROC曲线

ROC曲线的横坐标为false positive rate(FPR),纵坐标为 true positive rate(TPR)
当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。根据每个测试样本属于正样本的概率值从大到小排序,依次将 “Score”值作为阈值threshold,当测试样本属于正样本的概率 大于或等于这个threshold时,认为它为正样本,否则为负样本。
一个典型的ROC曲线如下图:
这里写图片描述

计算出ROC曲线下面的面积,就是AUC的值。 介于0.5和1.0之间,越大越好。

  • PRC曲线

在正负样本分布得极不均匀(highly skewed datasets)的情况下,PRC比ROC能更有效地反应分类器的好坏。
PRC曲线和ROC曲线有些类似,但是又有不同:

使用Weka进行数据挖掘(Weka教程八)Weka分类评价Evaluation输出分析_第2张图片

  • 其他指标

1、kappa statics Kappa
值即内部一致性系数(inter-rater,coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。Kappa≥0.75两者一致性较好;0.75>Kappa≥0.4两者一致性一般;Kappa<0.4两者一致性较差。

2、Mean absolute error 和 Root mean squared error
平均绝对误差和均方根误差,用来衡量分类器预测值和实际结果的差异,越小越好。

3、Relative absolute error 和 Root relative squared error
相对绝对误差和相对均方根误差,有时绝对误差不能体现误差的真实大小,而相对误差通过体现误差占真值的比重来反映误差大小。

你可能感兴趣的:(Weka+Java数据挖掘)