实战HMM-Viterbi角色标注地名识别

实战HMM-Viterbi角色标注地名识别
命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写等固定形态的语言。上次介绍过《实战HMM-Viterbi角色标注中国人名识别》,这次基于类似的原理,为HanLP实现中文地址地名(NS)的自动识别。原理训练对熟语料自动角色标注,统计单词的角色频次、角色的转移概率等,训练出一个模型,同时总结一些可用的模式串。识别根据上述模型,利用HMM-Viterbi算法标注陌生文本,利用Aho-Corasick算法模式匹配,匹配出可能的地址,将其送入第二层...

继续阅读:码农场 » 实战HMM-Viterbi角色标注地名识别

原文链接:http://www.hankcs.com/nlp/ner/place-names-to-identify-actual-hmm-viterbi-role-labeling.html

你可能感兴趣的:(实战HMM-Viterbi角色标注地名识别)