词性标注

词性标注_第1张图片
词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。在汉语中,词性标注比较简单,因为汉语词汇词性多变的情况比较少见,大多词语只有一个词性,或者出现频次最高的词性远远高于第二位的词性。据说,只需选取最高频词性,即可实现80%准确率的中文词性标注程序。利用HMM即可实现更高准确率的词性标注,本文旨在介绍HanLP中的词性标注模块。训练HanLP中使用了...

继续阅读:码农场 » 词性标注

原文链接:http://www.hankcs.com/nlp/part-of-speech-tagging.html

你可能感兴趣的:(词性标注)