基于深度学习的聊天机器人

基于深度学习的聊天机器人-项目前期知识准备

文章目录

  • 基于深度学习的聊天机器人-项目前期知识准备
  • 一、TensorFlow框架简介
  • 二、NLP基础
    • 1. 常用的神经网络模型
    • 2. 词法分析
    • 3.贝叶斯和朴素贝叶斯
    • 4. 隐马尔科夫模型
    • 5. 语料相关
    • 6. 语言模型
    • 7. 词向量Word2vec


一、TensorFlow框架简介

TensorFlow 是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现。
1、谷歌基于DistBelief进行研发的第二代人工智能学习系统
2、用于语音识别或图像识别等多项机器学习和深度学习领域
3、将复杂的数据结构传输至人工智能神经网中进行分析和处理
4、支持CNN、RNN和LSTM算法,是目前在Image,Speech和NLP中最流行的深度神经网络模型。
使用流程见下图
基于深度学习的聊天机器人_第1张图片

二、NLP基础

以下链接均为各路大神所写,请移步学习。
如有侵权,联系删除!


1. 常用的神经网络模型

  1. 卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它包括卷积层(convolutional layer)和池化层(pooling layer)。
    大话卷积神经网络CNN

  2. 循环神经网络(Recurrent Neural Network, RNN)是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。
    大话循环神经网络RNN

  3. LSTM (Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
    LSTM原理及实现

  4. BP神经网络

2. 词法分析

  1. 分词技术
  2. 词性标注
  3. 命名实体识别
  4. 词义消歧

3.贝叶斯和朴素贝叶斯

贝叶斯和朴素贝叶斯

4. 隐马尔科夫模型

隐马尔科夫模型

5. 语料相关

语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。语料库中存放的是在语言的实际使用中真实出现过的语言材料。真实语料需要经过加工(分析和处理),才能成为有用的资源。

  1. 获取途径
    1.1 开放型语料数据集
    1.2 爬虫
    1.3 自有平台
  2. 语料处理
    2.1 获取语料
    2.2 格式化文本(去杂)
    2.3 特征工程

6. 语言模型

  1. Unigram models(一元文法统计模型)
  2. N-gram语言模型 (N元模型)

7. 词向量Word2vec

词向量1
词向量2

你可能感兴趣的:(深度学习,自然语言处理,tensorflow,深度学习)