PR曲线图

PR曲线的介绍:
  PR曲线:表示精准率与召回率的关系。 
  recall(精准率)与precision(召回率)的介绍:
  首先了解混淆矩阵:
PR曲线图_第1张图片
把正例正确地分类为正例,表示为TP,把正例错误地分类为负例,表示为FN。
把负例正确地分类为负例,表示为TN,把负例错误地分类为正例,表示为FP。
从混淆矩阵可以得出精准率与召回率:
precision = TP/(TP + FP)
recall = TP/(TP +FN)

 画PR曲线:一般是以将recall(精准率)设置为横坐标,precision(召回率)设置为纵坐标。

 PR曲线图_第2张图片

PR曲线的作用:选择合适的阈值(比如K%)对样本进行合理的划分,概率大于K%的样本为正例,小于K%的样本为负例,样本分类完成后计算相应的精准率和召回率,最后我们会得到对应关系。

由于需要找到一个合适的阈值满足要求,看图可知,精准率高则召回率低,精准率低则召回率高。而我们需要两者都高,则需要一个定义一个新的指标:F1分数,确保得到一个最好的阈值,F1分数 = 2 P * R / (P+R),由此我们可以得出一个合适的阈值。

你可能感兴趣的:(python,人工智能)