【文献阅读】SAAA——堆叠多层注意力的VQA网络(T. Do等人,ArXiv,2017,有代码)
一、背景文章题目:《Show,Ask,Attend,andAnswer:AStrongBaselineForVisualQuestionAnswering》ArXiv上的一篇文章,虽然是17年的比较早,但是比较经典,后面看到很多新的模型都与这个模型进行了对比。看了一下模型结构,算是SAN网络的升级版吧。文章下载地址:https://arxiv.org/pdf/1704.03162.pdf文章引用格