机器学习中精准度、召回率、准确率、F1 Score、G分数计算学习笔记

目录

1、基本符号表示

2、类别下的精准度计算(precision)

3、类别下的召回率计算(recall)

4、准确率的计算(accuracy)

5、F1 Score

6、G分数


1、基本符号表示

        TP (true positive):预测结果正确,将本类事物预测为本类标签;

        FP(false positive):预测错误,比如,将非本类事物预测为本类标签。 

        FN(false negative):预测错误,比如,将本类事物预测为其他类标签。

        TN(true negative):预测正确,将非本类事物预测为对应的类标签(不是本类的标签)。

2、类别下的精准度计算(precision)

        指被分类器(classifier)划分为正样例(本类标签)中的正样本的比重值。

\large precision = \frac{TP}{TP + FP}

3、类别下的召回率计算(recall)

        指的是被预测为正样例(本类标签)占总的标签(本类标签+其他类标签)的比重值。

\large \large recall = \frac{TP}{TP + FN}

4、准确率的计算(accuracy)

 \large \large accuracy = \frac{TP+TN}{TP + TN + FP + FN}

5、F1 Score

        F1分数,也是分类的一个指标。表示精准度和召回率的调和平均值,其取值范围为:

0<= F1 <= 1

        F1 的计算方法如下(表示一个类别的F1 Score的计算):

\large F1 = 2 * \left ( \frac{precision * recall }{precision + recall} \right )

        F1在Python的sklearn包中有直接函数可以被调用,原函数sklearn.metrics.f1_score(参数)

        通常情况下,利用各个类别下的F1 Score的均值作为评价结果,计算方法:

\large resultscore = \left ( \frac{1}{n} \sum f1_{k}\right )^{2}

        F1 表示精准率和召回率同等重要

        F2 表示召回率的重要程度是精准率的2倍。

        F0.5 表示召回率的重要程度是精准率的0.5倍。

        如下通用公式

\large F\beta = \left ( 1+\beta ^{2} \right ) * \left ( \frac{precision * recall}{\left ( \beta ^{2}*precision \right ) + recall} \right )

6、G分数

        G分数也是评估精准率和召回率关系的一个指标,被定义为召回率和精准率的几何平均数。

计算公式为:

\large G = \sqrt{precision * recall}

你可能感兴趣的:(机器学习,知识抽取,自然语言处理,机器学习)