刚开始学机器学习尤其是计算机视觉的同学一定会接触到精确率(Pecision)和召回率(Recall)这两个词,看了公式还是一脸懵逼,今天就来通俗易懂的解释一下这两个关键的指标!
这两个指标核心实质可以总结为:
提升精确率是为了不错报、提升召回率是为了不漏报
首先要了解一下TP、FP、TN、FN的基本概念
不知道大家找到规律了没有,其实很好记,重点来了!!!
记忆方法:(通俗简化理解来方便记忆)
见到这四个词可以从后往前翻译:
(1)先看第二个字母,P代表做出Positive的判定(比如可以简单理解为预测下雨这件事会发生),而N代表代表做出Negative的判定(比如可以简单理解为预测下雨这件事不发生)
(2)然后看第一个字母,T代表模型做出的判定是正确(True)的(比如可以简单理解为天气预报的结果和实际当天情况符合),F代表模型做出的判定是正确(False )的(比如可以简单理解为天气预报的结果和实际当天情况不符合)
Tips:
这里大家可以思考一下:(下面会用到)
预测结果为正类(Positive)的数量 = ?+ ?
实际(真值)为正类(Positive)的数量 = ?+ ?
在这里先正确区分一下精确率和准确率,以及他们的别称
准确率很好理解,被正确预测出来的数量除以所有的样本数量,
而召回率和精确率的区别很容易混淆,即使记住了公式,过段时间还是会忘掉,这里完全讲清楚这几个率的区别
精确率和召回率分子是一样的,就是只有分母不一样,上面的思考题在这里就可以用上了
预测结果为正类(Positive)的数量 = TP+ FP
实际(真值)为正类(Positive)的数量 = TP+ FN
(这里需要转一下脑筋,模型做出了Negative的预测判定,但是判定是错误的,不就说明实际是Positive吗?)
你的老板让你做一个地震预测模型(以天为单位记某一天地震为正样本,不地震为负样本),你需要预测接下来100天的地震情况。
假设你知道第50天和51天会地震,其余的1-49和51-100天不会地震。
现在假设你的模型已经做好,但是不能精确率和召回率二者不可得兼,摆在你面前的是提升其中的一个率,你应该怎么办?
精确率: 分母是预测到的正类,精确率的提出是让模型的现有预测结果尽可能不出错(宁愿漏检,也不能让现有的预测有错)
强化一下最开始的总结:提升精确率是为了不错报、提升召回率是为了不漏报
以地震预测为例就是说宁愿地震了没报,也不能误报地震,比如说为了不错报,只预测了第50天可能发生地震,此时的
1.精确率:1/1=100%
2.召回率:1/2=50%
虽然有一次地震没预测到,但是我们做出的预测都是对的。
召回率: 分母是实际原本的正类,召回率的提出是让模型预测到所有想被预测到的样本(就算多预测一些错的,也能接受)
强化一下最开始的总结:提升精确率是为了不错报、提升召回率是为了不漏报
以地震模型为例说这100次地震,比如说为了不漏报,预测了第30天、50天、51天、70天、85天地震,此时的
1.精确率:2/5=40%
2.召回率:2/2=100%
虽然预测错了3次,但是我们把会造成灾难的2次地震全预测到了。
假设地震发生没有预测到会造成百亿级别的损失,而地震没发生误报了地震会造成百万级别的损失
显然,这种情况下我们应该接受为了不能漏掉一次地震而多次误报带来的损失,即提升召回率
精确率和召回率有什么用?为什么需要它?通俗讲解上面我们已经讲的很清楚了,这里以两种需求为例
人脸识别支付:主要提升精确率,更倾向于不能出现错误的预测。
应用场景:你刷脸支付时就算几次没检测到你的脸,最多会让你愤怒,对银行损失不大,但是如果把你的脸检测成别人的脸,就会出现金融风险,让别人替你买单,对银行损失很大。所以宁愿让你付不了钱,也不会让别人帮你付钱。
预测地震:主要提升召回率 ,更倾向于宁愿多预测一些错的也不能漏检。
应用场景:地震预测时宁愿多预测一些错的,也不想漏掉一次地震,预测错误最多会让大家多跑几趟,造成少量损失。只要预测对一次,就会挽回百亿级别的损失,之前所有的损失都值了。
不同的应用场景,需要的评价标准不一样,所以才会有这些率。
一、TP、FP、TN、FN理解记忆方法:(通俗简化理解来方便记忆)
见到这四个词可以从后往前翻译:
(1)先看第二个字母,P代表做出Positive的判定(比如可以简单理解为预测下雨这件事会发生),而N代表代表做出Negative的判定(比如可以简单理解为预测下雨这件事不发生)
(2)然后看第一个字母,T代表模型做出的判定是正确(True)的(比如可以简单理解为天气预报的结果和实际当天情况符合),F代表模型做出的判定是正确(False )的(比如可以简单理解为天气预报的结果和实际当天情况不符合)
二、指标核心实质可以总结为:
提升精确率是为了不错报、提升召回率是为了不漏报!
参考文献:(感谢两个知乎大佬的解释!)
https://zhuanlan.zhihu.com/p/93586831
https://zhuanlan.zhihu.com/p/31458989’
欢迎大家扫码关注本人公众号:编程复盘与思考随笔
(关注后可以免费获得本人在csdn发布的资源源码)
公众号主要记录编程和刷题时的总结复盘笔记和心得!并且分享读书、工作、生活中的一些思考感悟!
想要组队一起参加阿里天池,kaggle,百度飞浆,科大讯飞等AI相关的比赛的同学可以扫下面的二维码加微信一起讨论学习!