机器学习性能评估指标

混淆矩阵

True Positive(真正, TP):将正类预测为正类数.

True Negative(真负 , TN):将负类预测为负类数.

False Positive(假正, FP):将负类预测为正类数 →→ 误报 (Type I error).

False Negative(假负 , FN):将正类预测为负类数 →→ 漏报 (Type II error).

1. 准确率(precision) : 预测为正的样本中有多少是真正的正样本(你认为的该类样本,有多少被你猜对了)。
P = T P / ( T P + F P ) P=TP/(TP+FP) P=TP/(TP+FP)
2. 召回率(recall,TPR): 样本中的正例有多少被预测正确了(该类样本有多少被找出来了)。
R = T P / ( T P + F N ) R=TP/(TP+FN) R=TP/(TP+FN)
3. 精度(accuracy):样本量不均衡时慎用。
A C C = ( T P + T N ) / ( T P + T N + F P + F N ) ACC=(TP+TN)/(TP+TN+FP+FN) ACC=(TP+TN)/(TP+TN+FP+FN)
在信息检索领域,准确率和召回率又被称为
查准率
查全率
查准率=检索出的相关信息量 / 检索出的信息总量
查全率=检索出的相关信息量 / 系统中的相关信息总量

4. 漏报率(FNR):1-召回率
5. 误报率(FPR): FP/(TN+FP)

参考资料:

  1. 周志华-机器学习
  2. 维基百科

你可能感兴趣的:(机器学习工程思考,机器学习)