分类和回归的评价指标

分类
精确率是自分类正确的正样本个数占分类器判定为正样本的样本个数的比例 。
召回率是指分类正确的正样本个数占真正的正样本个数的比例 。
分类和回归的评价指标_第1张图片
查准率Precision:
在这里插入图片描述
查全率Recall:
在这里插入图片描述
F-Score,即precision和recall的调和平均值,更接近其中较小的那一个值:
在这里插入图片描述
正确率Accuracy:
在这里插入图片描述
分类和回归的评价指标_第2张图片
ROC,主要用于画ROC曲线(横坐标为FPR,纵坐标为TPR)。
AUC:ROC曲线下的面积,越接近1代表分类效果越好
ROC曲线的两种画法
方法一:一组预测结果根据设置不同阈值得到ROC曲线,阈值为正无穷时,模型把全部样本预测为负例, FPR 和 TPR 都为 0 ,因此曲线的第一个点的坐标就是( 0 , 0 ) 。 当把阈值为 0.9 时 ,得到一组 FPR 和 TPR, 对应 ROC 曲线上的某点。依次调整阈值,直到画出全部的关键点 2,再连接关键点即得到最终的 ROC 曲线 如图所示 。
分类和回归的评价指标_第3张图片
方法二:更直观地绘制 ROC 曲线的方法 。 首先,根据标签 统计出正负样本的数量 ,假设正样本数量为 P , 负样本数量为 N;把横轴的刻度间隔设置为 1 /N , 纵轴的刻度间隔设置为 1 /P;再根据模型输出的预测概率对样本进行排序(从高到低) ;依次遍历样本,同时从零点开始绘制 ROC 曲线,每遇到一个正样本就沿纵轴方向绘制一个刻度间隔的曲线,每遇到一个负样本就沿横轴万向绘制一个刻度间隔的曲线 3,直到遍历完所有样本,曲线最终停在( 1,1 )这个点,整个 ROC 曲线绘制完成 。
分类和回归的评价指标_第4张图片
回归
误差平方和SSE:
在这里插入图片描述
一般情况下, RMSE 能够很好地反映回归模型预测值与真实值的偏离程度 。 但在实际问题中,如果存在个别偏离程度非常大的离群点时,即使离群点数量非常少 也会让 RMSE 指标变得很差 。此时可以用比 RMSE 的鲁棒性更好的指标,比如平均绝对百分比误差( Mean Abso lute PercentError, MAPE ) , 官定义为:
在这里插入图片描述
R-Square(决定系数)
分类和回归的评价指标_第5张图片
越接近1越好

你可能感兴趣的:(分类和回归的评价指标)