Bidirectional Recurrent Neural Networks

摘要

  • a regular recurrent neural network (RNN → \rightarrow a bidirectional recurrent neural network (BRNN)
  • a preset future frame: 预设的未来架构。
  • . Structure and training procedure: 架构和训练程序。
  • TIMIT database.

INTRODUCTION

  • the parameters of the model 能够由监督训练过程所决定。
  • Artificial neural networks: 人工神经网络(ANN)
  • Multilayer perceptrons :MLP
  • static data patterns静态数据模式
  • 多层前馈网络在处理静态数据上是受限的。
  • f the size of the input window in advance:提前设计输入窗口的数量。
  • different ANN structures: 调研了不同的ANN结构。
  • 改进RNN的版本:
    双向循环神经网络:
    a bidirectional recurrent neural network,

Technical

Consider a sequence of input data vectors:
X 1 T = { x 1 , x 2 , x 3 , ⋯   , x T − 1 , x T } X^{T}_1 = \{x_1,x_2,x_3,\cdots,x_{T-1},x_T\} X1T={x1,x2,x3,,xT1,xT}
a sequence of corresponding output data vectors
y 1 T = { y 1 , y 2 , y 3 , ⋯   , y T − 1 , y T } y^{T}_1 = \{y_1,y_2,y_3,\cdots,y_{T-1},y_{T}\} y1T={y1,y2,y3,,yT1,yT}
目的是学习一种规则,给定输入数据去预测输出数据

  • 输出是连续的,问题被定义为回归问题。
  • 输出是类别标签的,问题被定义为分类问题。
  • Unimodal Regression:单峰回归。或函数最大化。
  • 输出数据假设:Gaussian with zero mean and a fixed global
    data-dependent variance

Bidirectional Recurrent Neural Networks_第1张图片

  • the convenient Euclidean distance 欧几里得距离。
  • themean-squared-error criterion: 均方误差标准
    • thecross-entropycriterion 交叉熵标准

分类

  • amultinomial out putdistribution:多项式输出分布。
  • Bidirectional Recurrent Neural Networks_第2张图片
  • Bidirectional Recurrent Neural Networks_第3张图片
  • .BidirectionalRecurrentNeuralNetworks

    • BRNN能够被训练:
    • using allavailable input informationin the past and future of a specific time frame
  • (使用过去和未来的输入信息)一个特定的时间框架。
    Bidirectional Recurrent Neural Networks_第4张图片

总结

这篇文章,先不当做重点读,先将代码给其复现完整,全部都将其搞定,慢慢的将其研究透彻。在开始学习这篇文章,开始研读这篇文章都行啦的理由与打算。慢慢的开始将代码给读透彻,研读彻底。

你可能感兴趣的:(11,人工智能)