P-R曲线

P-R曲线_第1张图片

Inst#是样本序号,图中有20个样本。Class是ground truth 标签,p是positive样本(正例),n当然就是negative(负例) score是我的分类器对于该样本属于正例的可能性的打分。因为一般模型输出的不是0,1的标注,而是小数,相当于置信度。

然后设置一个从高到低的阈值y,大于等于阈值y的被我正式标注为正例,小于阈值y的被我正式标注为负例。

显然,我设置n个阈值,我就能得到n种标注结果,评判我的模型好不好使。

比如阈值0.9,只有第一个样本被我判断为正例,那么我的查准率precision就是100%,但是查全率recall就是10%。

阈值0.1,所有样本都被我判断为正例,查全率是100%,查准率就是50%

 

最后我能得到若干对precision,recall值(P,R)  :    (1, 0.1),... ,(0.5,1),将这若干对花在图上,再连接起来就是这个pr曲线了
 

P-R曲线_第2张图片

你可能感兴趣的:(机器学习)