机器学习学习中评价模型好坏的标准

准确率(Accuracy):这个公式计算比较简单,就是预测正确的样本数量除以总的样本数量

但是很多时候,这个往往不能满足要求,比如样本不平衡,比如我们更加关心另一类的预测情况,这就会有问题, 比如你的样本不均衡,以两类问题为例:如果+1为10000,-1为50,那么只要过拟合,即使-1全部分错,正确率也是非常高的。如果我们更加关心-1的分类情况,这也没法实现。所以引入了另外的指标

准确率(Accuracy):(#(True positive) + # (True negative) ) / (#(True positive) + # (True negative) + #(False positive) + # (False negative))

召回率(Recall):#(True positive)  / (#(True positive)  + #(False positive) )

精确率(Precision):#(True positive)  / (#(True positive)  + #(False  negative) )

F1: (A*A+1)*Recall*Precision/(A*A*(Recall+Precision))

A用于衡量召回率和精确率两者之间的重要,如果等于1,表示一样重要。

#(True positive) :代表第一类正确分类的样本数量。#(True negative):代表第二类分类正确的样本。#(False positive) :第二类误认为第一类的样本。 # (False negative):表示第一类误认为第二类的样本数量。

你可能感兴趣的:(机器学习--ML)