工智能基础知识总结-- 什么是Seq2Seq

  1. 什么是Seq2Seq

    Seq2Seq模型,全称Sequence to sequence,由EncoderDecoder两个部分组成,每部分都是一个RNNCell(RNN、LSTM、GRU等)结构。Encoder将一个序列编码为一个固定长度的语义向量,Decoder将该语义向量解码为另一个序列。输入序列和输出序列都可以是不定长序列。

    Seq2Seq可以用于机器翻译、文本摘要生成、对话生成等领域。

  2. Seq2Seq结构

    Seq2Seq包含一个RNN作为Encoder对输入序列进行编码,一个RNN作为Decoder对输出序列进行解码。下面参考https://zhuanlan.zhihu.com/p/70880679介绍两种最常用的Seq2Seq结构。

    为简化描述,这里都以RNN代替LSTM和GRU,并且省略偏置项。

    • 结构1

      工智能基础知识总结-- 什么是Seq2Seq_第1张图片

      Encoder输入序列ABC,生成语义向量 c 作为Decoder的初始隐藏状态,Decoder中初始时刻输入

你可能感兴趣的:(机器学习专栏,人工智能学习专栏,深度学习专栏,机器学习,人工智能,深度学习)