个人对ROC曲线坐标的理解

个人对ROC曲线坐标的理解_第1张图片
横坐标(假正率)就理解为“误伤率”,即我为了把更多的少数类预测出来,而把多数类判断为少数类的概率,即误伤了本属于多数类的样本。
纵坐标(召回率)就理解为“捕捉率”,即我把更多的少数类捕捉到了的概率。

由上图可以看出,“误伤率”当然随着阈值的变大,变化要缓慢为宜,即随着纵坐标的增加,横坐标变化越小越好;
“捕捉率”则相反,即随着横坐标的增加,纵坐标越快越好。

举个警察抓小偷的例子:100个人,里面好人90人,坏人10人;横坐标就是误伤的概率,即随着阈值的增加,希望我每次判断的时候只会把极少数好人判断成坏人,最好是每次都可以真正把坏人抓出来,而不要宁可错杀一千而不放过一个,所以他关注的只是好人是否被你说成坏人的概率,那当然是每次判断的时候,被我把好人说成坏人的数量越少越好洛。而纵坐标就是捕捉到坏人的概率,对象都是坏人,即意思是:我本来有10个坏人,你一开始只找出了5个坏人,随着阈值的变大,是否能够很快把剩下5个也找出来,这就是“捕捉率”(召回率)

你可能感兴趣的:(机器学习,人工智能)