中文分词评价指标

准确率(Precision)和召回率(Recall)

Precision = 正确切分出的词的数目/切分出的词的总数

Recall = 正确切分出的词的数目/应切分出的词的总数

 

综合性能指标F-measure

Fβ = (β2 + 1)*Precision*Recall/(β2*Precision + Recall)

β为权重因子,如果将准确率和召回率同等看待,取β = 1,就得到最常用的F1-measure

F1 = 2*Precisiton*Recall/(Precision+Recall)

 

未登录词召回率(R_OOV)和词典中词的召回率(R_IV)

R_OOV = 正确切分出的未登录词的数目/标准答案中未知词的总数

R_IV = 正确切分出的已知词的数目/标准答案中已知词的总数

你可能感兴趣的:(中文分词)