分类模型评估指标

一个良好的机器学习系统,其核心是合理的评估指标,在面对分类的类别不平衡的情况下,关于其评价指标有如下几个:

其在skLearn的API为:sklearn.metrics

二分类时:

混淆矩阵:(Confusion Matrix),函数:metrics.confusion_matrix,其形式为如下,:

分类模型评估指标_第1张图片

即有TP(真阳性),FP(假阳性),FN(假阴性),TN(真阴性),总样本数量为:Z = TP+FP+FN+TN

准确率Accuracy,就是预测准确的概率:(TP+TN)/Z。函数:metrics.accuracy_score

精确率Precision,是针对预测结果而言,预测为正的样本中真正的正样本:TP/(TP+FP)。函数:metrics.precision_score

召回率Recall,是针对样本而言,其表明的是样本中的正样本被预测准确的概率:TP/(TP+FN)。函数:metrics.recall_score

评价曲线:ROC(receiver operating characteristic curve)曲线,其纵坐标为(召回率):预测为正且实际为正的样本占所有正例样本的比例,横坐标为:预测为正但实际为负的样本占所有负例样本的比例 FP/FP+TN ;取定一个概率阈值,高于阈值的为正样本,低于阈值的为负样本。(这个位置可以看,对数几率回归的概率)。metrics.roc_curve

ACU指标:即ROC对横轴的面积。ACU的值越大,则其分类器的效果越好。metrics.roc_auc_score


多分类时:

混淆矩阵:

分类模型评估指标_第2张图片

也可以表示其分类(猫,狗,兔)的效果。

具体的讲解这篇文章很详细   https://www.jianshu.com/p/c61ae11cc5f6




你可能感兴趣的:(机器学习)