命名实体识别(NER)

       命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。

      一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。

        命名实体识别是作为分词的一个后续过程而存在的。

     

     分词库:

  1. NLPIR  张华平博士
  2. THULAC  清华大学
  3. jieba分词

 

参考资料:

1、http://hanlp.linrunsoft.com/doc/_build/html/ner.html

2、http://thulac.thunlp.org/

3、http://ictclas.nlpir.org/

你可能感兴趣的:(NLP,数据——创造新的价值的源泉)