机器学习p-R roc曲线原理详解

precision = TP/(TP + FP), recall = TP/(TP +FN)

P-R曲线是通过对(以2分类为例)分类阈值从1到0进行逐步下降时,所出现的一系列(p,r)的绘制形成的

对于一组正负样本分配均匀的数据来说,当分类阈值为1时,意味着所有样本都被分为负类,此时的p,r值都为0;分类阈值为0.9时,不会出现FP样本,故P为1,R因为TP数量不多,所以值并不大;随着阈值持续下降,R值会不断加大,而P值整体趋势下降但局部会有震荡。最终当阈值为0,即所有样本分为正类,此时P不会为0,R因为不存在FN,所以R值为1.所绘制的P-R图如下图

ROC曲线的绘制过程原理与P-R相似

横坐标 假阳率(FPR)=FP/N(N:真实负样本总数)

纵坐标 真阳率(TPR)=TP/P(P:真实正样本总数)

其是通过移动分类阈值(都是从大到小)来得到一系列(假阳率,真阳率)。这里就不分析了。

你可能感兴趣的:(pyer)