为什么使用ROC和AUC判断一个分类器的好坏呢?

首先我们先了解下什么是AUC和ROC,ROC的横轴表示为FPR(负正率),横轴表示NPR(真正率)。其中ROC曲线的斜率代表阈值,即阈值越来越小时,被分为正类的样例越来越多,但是还会掺杂着越来越多的负类样例。即TPR和FPR会同时增大。ROC具有很好的特性,当正类负类的样例数量发生变化时,ROC的曲线基本与原来的曲线保持一致,所以当正负例发生巨大变化时,我们还可以根据ROC曲线来评价分类器。谈起AUC,AUC值是一个概率值,当你随机挑选一个正样本以及负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值,AUC值越大,当前分类算法越有可能将正样本排在负样本前面,从而能够更好地分类。

你可能感兴趣的:(机器学习,机器学习面试问题)