precision,recall and precision-recall curve

precision是指检索出的结果中相关的比例,所以precision=true positive /(true positive+false negative). recall是指相关的条目被检索出的比例,所以recall= true positive/(true positive + false positive)。precision和recall双高当然是最好。但实际应用中往往precision和recall成反比关系。比如只检索出1条且相关,则precision为100%而recall则很低。而实际应用中则根据需要调整指标,比如如果是做搜索,那就是保证召回的情况下提升准确率;如果做疾病监测、反垃圾,则是保准确率的条件下,提升召回。

为了找到precision和recall的平衡点,往往会通过绘制precision-recall curve。PRC纵轴是precision,而横轴是recall,所以PRC曲线应该是越往右上凸越好(双高)而F1指则是结合了precision和recall的综合评估:2PR/(P+R)

通常还会用ROC曲线衡量分类器效果,ROC纵轴是true positive rate,横轴是false positive rate。通常tpr越高,fpr越低,分类器效果越好。所以ROC曲线越往左上凸越好。

你可能感兴趣的:(precision,recall and precision-recall curve)