机器学习常用评价指标实例分析:【查准率】【查全率】【F1-score】

目录

  • 一、问题导入
  • 二、概念理解
  • 三、问题解决
  • 四、参考资料

一、问题导入

  • 题目: 假如重庆交通大学准备招标采购一套宿舍行人目标图像识别系统,选择2家公司的产品来测试。测试手段是:从学生宿舍区一段监控视频中识别男生的人数。
  • 实验结果如下:
    算法1(产品1)的检测结果:检测出“男生”人数82人,其中78人为男生,4人其实是女生;
    算法2(产品2)的检测结果:检测出“男生”人数88人,其中80人为男生,8人其实是女生;
    经过人工检测,视频中实际准确的总人数为100人,其中男生80人,女生20人。
  • 问题: 请问算法1和算法2的 “ 查准率 ” “ 查全率 ” “ F1-score ” 等分别是多少?你认为哪个更优秀?

二、概念理解

  • 首先引入分类结果混淆矩阵概念:
真实情况 预测结果
正例 反例
正例 TP(true positive) FN(false negative)
反例 FP(false positive) TN(true negative)
  • 样本总数 = TP+FP+FN+TN;
  • 查准率: 预测为正例的实例中真实正例的比例;
    R = T P T P + F N R=\frac {TP}{TP+FN} R=TP+FNTP
  • 查全率: 真实正例被预测为正例的比例;
    P = T P T P + F P P=\frac {TP}{TP+FP} P=TP+FPTP
  • F1-score: 度量一个模型的好坏,综合考虑查准率和查全率。
    F 1 = 2 R P R + P = 2 T P 样 例 总 数 + T P − T N F1=\frac{2RP}{R+P}=\frac{2TP}{样例总数+TP-TN} F1=R+P2RP=+TPTN2TP

一般情况下,查准率高,查全率就会偏低,反之,查准率低,查全率就偏低。

三、问题解决

算法一:

  • 混淆矩阵如下:
真实情况 预测结果
78 2
4 16
  • 查准率:
    P = 78 78 + 2 = 0.975 P=\frac{78}{78+2}=0.975 P=78+278=0.975
  • 查全率:
    R = 78 78 + 4 = 0.9512 R=\frac{78}{78+4}=0.9512 R=78+478=0.9512
  • F1-score:
    F 1 = 2 × 78 100 + 78 − 16 = 0.963 F1=\frac{2×78}{100+78-16}=0.963 F1=100+78162×78=0.963

算法二:

真实情况 预测结果
80 0
8 12
  • 查准率:
    P = 80 80 + 0 = 1 P=\frac{80}{80+0}=1 P=80+080=1
  • 查全率:
    R = 80 80 + 8 = 0.91 R=\frac{80}{80+8}=0.91 R=80+880=0.91
  • F1-score:
    F 1 = 2 × 80 100 + 80 − 12 = 0.952 F1=\frac{2×80}{100+80-12}=0.952 F1=100+80122×80=0.952

总结:

评价指标 算法 1 优秀度 算法 2
查准率 0.975 1
查全率 0.9512 0.91
F1-score 0.963 0.952
  • 从查准率评价指标来看,算法 2 都要优于算法 1,从查全率和 F1 度量评价指标来看,算法 1 都要优于算法 2;
  • 总的来说,算法 2 更好。

四、参考资料

[1] 机器学习算法的常用评价指标——查准率,查全率,F1-score
[2] 【机器学习】(周志华–西瓜书) 真正例率(TPR)、假正例率(FPR)与查准率(P)、查全率(R)

你可能感兴趣的:(机器学习)