机器学习随笔二--查准率和查全率

机器学习随笔二--查准率(precision)和查全率(recall)

 一.混淆矩阵

通过真实情况和机器的预测结果,我们可以把最终得到的结果分为四类:真正例(true positive),假正例(false positive),真反例(true negative),假反例(false negative),TP+FN+FP+TN=样例总数

1. 真正例(true positive,TP):预测为真,实际为真 
2.假反例(false negative,FN):预测为假,实际为真  
3.假正例(false positive,FP):预测为真,实际为假
4.真反例(true negative,TN):预测为假,实际为假 

分类结果混淆矩阵
预测结果
真实情况 正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)

 

 

二.查准率和查全率解释

1.查准率是针对我们预测结果而言的,它表示的是预测为正的样本中多少是真正的正样本。我们可以把预测的结果分为两类,一种是正类预测为正类(TP),另一种是负类预测正类(FP)。按下图来看,预测为正的样本即selected elements(被选中的元素),其中真正的正样本是selected elements内颜色为绿色的部分。故查准率就是

机器学习随笔二--查准率和查全率_第1张图片

 

2.查全率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确。我们也可以把预测的结果分为两类,一种是正类预测为正类(TP),另外一种是正类预测为负类(FN)。简单来讲,查全率就是true positive 除以 relevant elements。也就是

机器学习随笔二--查准率和查全率_第2张图片

 

机器学习随笔二--查准率和查全率_第3张图片 查准率和查全率示意图

 

你可能感兴趣的:(机器学习,人工智能)