自然语言处理学习笔记(九)———— OVV Recall Rate与 IV Recall Rate

目录

1.OVV Recall Rate

2. IV Recall Rate


1.OVV Recall Rate

        OOV指的是“未登录词”(Out Of Vocabulary),或者俗称的“新词”,也即词典未收录的词汇。如何准确切分00V,乃至识别其语义,是整个NLP领域的核心难题之一。

2. IV Recall Rate

        IV指的是“登录词”(In  Vocabulary),相应的IV Recall Rate 指的是词典中的词汇被正确召回的概率。连词典中的词汇都无法百分之百召回,说明词典分词的消歧能力不好。就算“商品”“和服”“服务”都在词典中,词典分词依然分不对“商品和服务”。

你可能感兴趣的:(自然语言处理,自然语言处理,学习,笔记,python,人工智能)