每天五分钟机器学习:如何根据模型的训练结果绘制ROC曲线?

本文重点

在前面的课程中,我们学习了真阳性率和假阳性率的计算公式。使用真阳性率和假阳性率可以绘制出ROC曲线,ROC曲线有很多优秀的特点,经常作为评估二分类器最重要的指标之一。

如何绘制ROC曲线?

绘制方式一

如何才能绘制ROC曲线呢?使用阶段点的方式来完成。在二分类问题中,我们常常认为y=1的概率为50%,而y=0的概率为100%-50%=50%。也就是说一半对一半,也就是说截断点(阈值)就是50%。

如果要想绘制ROC曲线,就需要不断的调整阈值,比如y=1的概率为90%,而y=0的概率为10%,也就是说当模型输出的概率结果为0.9以上的时候才是y=1类别,而模型输出的概率结果为0.89的时候就是y=0的类别,不再以0.5为分界阈值了。

通过不断的动态调整截断点,从最高的得分开始(从正无穷开始),逐渐调整到最低得分,每一个截断点都会对应一个真阳性率和假阳性率,计算出所有的点,然后将其连起来,那么就构成了ROC曲线。

绘制方式二

统计数据集中正负样本的数量,假设正样本的数量为P、负样本的数量为N。接下来将横轴的刻度设置为1/N,而将纵轴的刻度设置为1/P。然后根据模型输出的预测概率对样本进行从高到低的排序。

遍历这个排序的结果,从零点开始绘制ROC曲线,每遇到一个正样本就沿着纵轴方向绘制一个刻度间隔的曲线,每遇到一个负样本就沿着纵轴方向绘制一个刻度间隔的曲线,等到遍历完所有的样本之后,曲线最终将会停止在(1,1)这个点,此时整个ROC曲线绘制完成。

你可能感兴趣的:(每天五分钟玩转机器学习算法,机器学习,人工智能,深度学习,算法,神经网络)