机器学习-查全率和查准率

记录搞懂机器学习中模型评估与选择的查全率和查准率

举个例子更好理解:

情景:瓜农拉了一车西瓜,这里面的西瓜只有好(Positive)坏(Negative)这两种类别。然后我用训练好的模型对这些西瓜的好坏进行判别。

这个模型作出的判断可能正确也可能错误,可能会把坏瓜判断为好瓜,也可能把好瓜判断为坏瓜,所以有以下四种情况:

a 真好瓜:本身就是好瓜,模型判断对了

b 假好瓜:本身是坏瓜,模型判断错了,想以假乱真,实则是个坏瓜

c 假坏瓜:本身是好瓜,模型判断错了,冤枉了好瓜,实则是个坏瓜

d 真坏瓜: 本身就是坏瓜,模型判断对了

有了这四个情况就需要知道模型的查准率P和查全率R,这样才能更好判断这个模型输出的数据对我们的利用价值

查准率就是计算这个模型分出的好瓜中是真正好瓜的比例,所以,查准率=真好瓜/模型判别出的好瓜=真好瓜/(真好瓜+假好瓜) = TP/(TP+FP)

查全率就是计算这个模型在实际存在的好瓜中找到真好瓜的比例,所以,查全率=真好瓜/(实际存在的好瓜)=真好瓜/(真好瓜+假坏瓜) = TP/(TP+FN)

PS:真->Ture  假->False

参考周志华的《机器学习》书本30页

你可能感兴趣的:(机器学习基础,机器学习笔记,机器学习,人工智能,深度学习)