TEXT-CNN分享

TEXT-CNN 模型

论文 Convolutional Neural Networks for Sentence Classification

TEXT-CNN分享_第1张图片
image

自然语言处理步骤

  • 获取数据
  • 数据预处理 字->数值 (文字数字化)
  • 构建网络(数值-> 网络 -> 结果)
  • 训练网络
  • 分析结果
  • 应用

字->数值? 用词向量!

TEXT-CNN分享_第2张图片

(得到词向量,可用skip-gram,cbow等方法)
(现在比较流行的字->数值 方法ELMO,bert)

构建网络 用卷积

TEXT-CNN分享_第3张图片

TEXT-CNN分享_第4张图片
image

特点

  • 查找特定模式(适合于新闻分类等各分类有专业术语的问题)

  • 训练速度极快

  • 对字来说提升效果比词好

更多

  • 二分类 样本不一样多,分错后的代价不一样
  • cnn网络架构优化

你可能感兴趣的:(TEXT-CNN分享)