分类算法评估-混淆矩阵、精确率和召回率以及F1_Score

分类算法评估-混淆矩阵、精确率和召回率

  1. 首先引入问题,为什么我们再评估分类算法的时候通常用精确率和召回率?

假设现在有1000个人。预测他们是否得了癌症。假设他们总共有900人是健康的,10人患癌症,那么在这种情况下我们如果将所有人都预测为健康的。
在这种情况下我们的准确率是: 99.0% 那我们的这个模型显然的不是一个好的模型。


所以就引出了精确率(precision)召回率(recall)
先来看一个混淆矩阵
分类算法评估-混淆矩阵、精确率和召回率以及F1_Score_第1张图片
这里的T就是True,F就是False,P就是Positive(阳性),N就是Negative(阴性)
TN代表的意思也就是:预测的是0 实际也是0
FP代表的意思也就是:预测的是1 实际是0
FN代表的意思也就是:预测的是0 实际是1
TP代表的意思也就是:预测的是1 实际上也是1

然后我们的求精准率的公式就有了 ↓↓↓
精准率公式:
精准率公式


召回率公式:分类算法评估-混淆矩阵、精确率和召回率以及F1_Score_第2张图片

文字表达就是**?*
精确率 = 判断为1实际为1 跟 所有预测为1的比例
召回率 = 判断为1实际为1 跟 所有实际为1的比例

这就是精确率和召回率了。其实在不同的情况下所注重的不同,在某些问题上注重精确率,在某些问题上注重召回率。

还有一个评估方法结合了精确率召回率,那就是F1_Score
F1_Score将精确率和召回率都兼顾了,也就是求了精确率和召回率的调和平均值。

F1_Score的公式为:
F1分数

					 原			创

你可能感兴趣的:(机器学习)