RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结

RMSE(root mean square error)均方根误差

单纯统计误差的值。

 

MAPE(mean absolute percentage error) 平均百分比误差

存在一个和原始数据相比较的过程。

 

RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结_第1张图片

准确率(precision)P:

P=TP/(TP+FP)

TP(true positive) FP(false positive)

P是代表预测为真且真实为真的数据占预测为真数据的比例。

 

召回率(recall)R:

R=TP/(TP+FN)

FN(false negitive)

R是代表预测为真且真实为真的数据占真实为真数据的比例。

F1三维显示如下:

RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结_第2张图片

由图可见 单纯地追求P、R的提升并没有太大作用。

思考:当真实数据比例较大时,一般的模型也能跑出较好的结果。

 

TPR=TP/(TP+FN) 

TPR(true positive rate)和R相同,代表预测为真的真数据占真实为真数据的比例。

FPR=FP/(FP+TN)

FPR(false positive rate)伪正例占真负例的比例。

ROC是由点(TPR,FPR)组成的曲线,AUC就是ROC的面积。AUC越大越好。




 

你可能感兴趣的:(数据挖掘)