自然语言处理总复习(八)—— 文本分类

自然语言处理总复习(八)—— 文本分类

  • 一、相关概念和介绍
    • (一)分类技术在自然语言中的应用
    • (二)文本分类的一般过程
      • 1. 一些名词
      • 2. 分类过程展示
  • 二、分类方法
    • (一)朴素贝叶斯分类
      • 1. 假设
      • 2. 参数计算
      • 3. 算法(训练)
      • 4. 举例
      • 5. 讨论
    • (二)K近邻
      • 1. 介绍
      • 2. 算法
      • 3. KNN中的相似度量
      • 4. 图示
    • (三)决策树分类和最大熵分类
    • (四)支持向量机分类

一、相关概念和介绍

(一)分类技术在自然语言中的应用

自然语言处理总复习(八)—— 文本分类_第1张图片

(二)文本分类的一般过程

1. 一些名词

  • 训练集
  • 数学模型
  • 训练过程
  • 测试集
  • 评价

2. 分类过程展示

自然语言处理总复习(八)—— 文本分类_第2张图片

二、分类方法

(一)朴素贝叶斯分类

1. 假设

自然语言处理总复习(八)—— 文本分类_第3张图片

2. 参数计算

自然语言处理总复习(八)—— 文本分类_第4张图片

3. 算法(训练)

自然语言处理总复习(八)—— 文本分类_第5张图片

4. 举例

自然语言处理总复习(八)—— 文本分类_第6张图片

5. 讨论

在这里插入图片描述

(二)K近邻

1. 介绍

自然语言处理总复习(八)—— 文本分类_第7张图片

2. 算法

自然语言处理总复习(八)—— 文本分类_第8张图片

3. KNN中的相似度量

  • 最简单的是欧式距离
  • 最常用的还是用TF-IDF 计算权重,用Cosine计算相似度的方法

4. 图示

自然语言处理总复习(八)—— 文本分类_第9张图片

(三)决策树分类和最大熵分类

(四)支持向量机分类

你可能感兴趣的:(自然语言处理,分类,自然语言处理,机器学习)