分类器评价指标

混淆矩阵

实际样本 预测结果
正例 反例
正例 TP(正预测为正,真正) FN(正预测为负,假负)
负例 FP(负预测为正,假正) TN(负预测为负,真负)

1.准确率

Acc = \frac{TP+TN}{TP+TN+FP+FN}

TP和TN:表示预测正确的

2.1. 查准率:(精确率),预测为真占预测为真的百分比,表示对正样本的预测准确程度(预测为正/所有为正的预测)。

P=\frac{TP}{TP+FP}

2.2. 查全率:(召回率),实际样本为正中预测为正的比例,(预测为正/所有为正的样本)

Recall = \frac{TP}{TP+FN}

2.3 F1, 兼顾精确率和召回率

F1=\frac{2*P*R}{P+R} =\frac{2*TP}{ALLNUM+TP-TN}


3.1. 灵敏度,真正率(True Positive Rate , TPR),正样本预测正确的/正样本总数:

TPR=\frac{TP}{TP+FN}

3.2.特异性,真假率(True Negative Rate , TNR),负样本预测正确的/负样本总数:

TNR=\frac{TN}{TN+FP}

3.3. 假负率:(False Negative Rate , FNR),FNR=1-TPR, 正样本预测错误的/正样本总数。

3.4. 假正率: (False Positive Rate , FPR),FPR=1-TNR,负样本预测错误的/负样本总数。

灵敏度和特异度可以解决样本不平衡的问题,因为灵敏度只关注正样本检出率,特异度只关注负样本检出率。

3.5. ROC

纵坐标:真正率(灵敏度);

横坐标:假正率(1-特异性);

优势:

不受阈值选择影响;(ROC曲线各点是根据不同阈值绘制出的点)

正负样本不均匀不影响ROC评价;(灵敏度、特异度计算只分别关注正样本和负样本)

AUC=\frac{\sum_{insi\in pos}rank_{insi}-M*(M-1)/2 }{M*N}

\sum_{insi\in pos}rank_{insi}表示将pre递增排序后,正样本label对应的排序序号之和。

你可能感兴趣的:(深度学习,深度学习)