SVM二分类和多分类问题的关键指标

一、二分类问题

SVM二分类和多分类问题的关键指标_第1张图片

 

1、Accuracy

2、Precision:主要评估在预测为Positive的样本中,真实的Positive样本有多少;

3、Recall:在所有的Positive样本中,最终有多少Positive样本被预测成功;

(就1、2、3举个栗子:某医院开发一套诊断癌症的AI系统,若想评估其性能好坏,可以通过Accuracy、Precision以及Recall评估。Accuracy:在一堆人中有正常人也有癌症患者,有多少人被给出了正确的诊断结果?即正常人被诊断为正常人,癌症患者被诊断为癌症患者;Precision:被诊断为癌症患者的人中,实际有多少人是癌症患者;Recall:在一堆得了癌症的人中,实际有多少人被诊断出得了癌症)

4、F1-score:Precision和Recall的综合,Precision和Recall应该越高越好,也就是F1-score应该越高越好。

二、多分类问题

Accuracy是度量全局样本的预测情况。多分类问题中,每类都需要单独计算其Precision和Recall。(不能像二分类问题中直接计算Precision和Recall,应该单独计算每类的Precision和Recall)

举栗子说明:

如果需要开发一个动物识别系统,需要识别出图片中的动物是狗、猪还是猫

SVM二分类和多分类问题的关键指标_第2张图片

 如果想评估该识别系统的总体功能,必须考虑猫、狗、猪三个类别的综合预测性能。

综合该三个类别的Precision的方法有以下几种:

1、Macro-average方法

SVM二分类和多分类问题的关键指标_第3张图片 

2、Micro-average方法

SVM二分类和多分类问题的关键指标_第4张图片

SVM二分类和多分类问题的关键指标_第5张图片

3、Weighted-average方法

SVM二分类和多分类问题的关键指标_第6张图片

 

你可能感兴趣的:(分类,python)