自然语言处理学习笔记一(入门学习)

   一、自然语言处理

            它是一门融合了计算机科学、人工智能以及语言学的交叉学科。

 二、自然语言的特点

          1.  词汇量大(现代汉语常用词表总共收录了56008个词条)

          2.  非结构化

          3.  歧义性

          4.  容错性(句子错的离谱,但是都可以猜出想要表达的意思)

          5.  易变性(语言都是不断发展变化的)

          6.  简略性(人类语言简洁、干练,如一些简称,代号等)

三、自然语言处理的层次

         1.  语音、图像和文本

         2.  中文分词、词性标注(歧义消除)与命名实体识别(识别专有名词)

         3.  信息抽取

         4.  文本分类与文本聚类

         5.  句法分析(主谓宾的结构,侧重语法)

         6.  语义分析与篇章分析(侧重于语义)

         7.  其他高级任务(自动问答、自动摘要、机器翻译等)

  四、自然语言处理的方法

         1.   基于规则的专家系统

         2.   基于统计的学习方法

         3.   深度学习

五、 常见的语料库

         1.  中文分词语料库

         2.  词性标注语料库

         3.  命名实体识别语料库

         4.  句法分析语料库

         5.  文本分类语料库

     

        

       

你可能感兴趣的:(自然语言处理,机器学习,人工智能)