词性标注

语法分析与词性标注

词性标注的理解

词性标注又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性,也即确定每个词是名词、动词、形容词或其他词性的过程

词性标注可以由人工或特定算法完成,使用机器学习方法实现词性标注是自然语言处理的研究内容。常见的词性标注算法包括隐马尔可夫模型( HMM)、条件随机场( CRFs)等

词性汇编表

词主要分为两类:
  • 实词:名词、动词、形容词、状态词、区别词、数词、量词、代词
  • 虚词:副词、介词、连词、助词、拟声词、叹词
语素的理解
  • 定义:语言中最小的音译结合体,满足三个条件——有音、有意、最小(不可分割)
  • 主要功能:构成词语的材料
实例:《PFR人民日报标注语料库》词性编码表

词性标注_第1张图片

语法分析

  • 理解

语法分析的任务是在词法分析的基础上将单词序列组合或将句子切分成各类语法短语,如“程序”,“语句”,“表达式”等等.

你可能感兴趣的:(人工智能)