accuracy, precision, and recall三者区别

首先, 正确率(accuracy)、 查准率(precision)、 查全率(recall)

分别进行表述:

正确率=(正确数/总数)*100%

查全率和查准率 
查全率和查准率是目前衡量检索效果的相对合理的指标 
查全率=(检索出的相关信息量/系统中的相关信息总量)*100% 
查准率=(检索出的相关信息量/检索出的信息总量)*100% 
前者是衡量检索系统和检索者检出相关信息的能力,后者是衡量检索系统和检索者拒绝非相关信息的能力。两者合起来,即表示检索效率。 
查全率和查准率都有局限性 
查全率的局限性主要表现在:它是检索出的相关信息量与存储在检索系统中的全部相关信息量之比,但系统中相关信息量究竟有多少一般是不确知的,只能估计;另外,查全率或多或少具有“假设”的局限性,这种“假设”是指检索出的相关信息对用户具有同等价值,但实际并非如此,对于用户来说,信息的相关程度在某种意义上比它的数量重要得多。 
查准率的局限性主要表现在:如果检索结果是题录式而非全文式,由于题录的内容简单,用户很难判断检索到的信息是否与课题密切相关,必须找到该题录的全文,才能正确判断出该信息是否符合检索课题的需要;同时,查准率中所讲的相关信息也具有“假设”的局限性。 
实验证明,在查全率和查准率之间存在着相反的相互依赖关系--如果提高输出的查全率,就会降低其查准率,反之亦然。 
对用户来说,影响检索效果的主要因素有文献标引的广泛性和用户检索标识的专指性

你可能感兴趣的:(accuracy, precision, and recall三者区别)