【论文泛读】Multimodal Neural Graph Memory Networks for Visual Question Answering

生成词向量的一种方法
理解GloVe模型(Global vectors for word representation)
GRU是LSTM的一种变形,LSTM和CRU都是通过各种门函数来将重要特征保留下来,这样就保证了在long-term传播的时候也不会丢失。此外GRU相对于LSTM少了一个门函数,因此在参数的数量上也是要少于LSTM的,所以整体上GRU的训练速度要快于LSTM的。
两个网络的好坏还是得看具体的应用场景。
门控循环单元(GRU)的基本概念与原理

你可能感兴趣的:(python,算法,人工智能,深度学习)