《Look, Imagine and Match: Improving Textual-Visual Cross-Modal Retrieval with Generative Models》
来源:CVPR2018一、Introduction第一篇同时利用GAN和ReinforcementLearning(RL)做跨媒体检索的文章。这个网络可以同时做三个跨媒体的任务:cross-mediaretrieval,imagecaptionandtext-to-imagesynthesis(对于后两个任务,文章只给出了可视化的结果,没有给出定量的分析)。这篇文章发表在CVPR2018上并且是S