数据分析学习之roc曲线

(一)ROC是什么?

     ROC 曲线指受试者工作特征曲线 (receiver operating characteristic curve), 是反映敏感性(正确判断病人概率)和特异性(正确判断非病人概率)连续变量的综合指标, 是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在 ROC 曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

(二)主要用途:

1最佳的诊断界限值,可以查出任意界限值对疾病的识别能力。

2比较两种或者两种以上不同诊断试验对疾病的识别诊断能力。(在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的 ROC 曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的 ROC 曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的 ROC 曲线下的面积 (AUC) 进行比较,哪一种试验的 AUC 最大,则哪一种试验的诊断价值最佳。)

(三)评价标准:

1在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

2一般来说,如果ROC是光滑的,那么基本可以判断没有太大的overfitting(过度拟合)

    其它类似功能:精确率、召回率、F1 值、AUC。



你可能感兴趣的:(数据)