图像描述生成笔记:Show and Tell: A Neural Image Caption Generator,2015年由谷歌团队创作,发布于年 IEEE 计算机视觉和模式识别会议CVPR
这篇论文是ImageCaption领域的开山之作,而我写的这篇笔记也是我在知乎创作的开端。ImageCaption,是指从图片中自动生成一段描述性文字。要求机器不仅能检测出图像中的物体,而且要理解物体之间的相互关系,最后还要用合理的语言表达出来。对人来说,这项任务soeasy,但是对机器来说,这就是极具挑战性了。首先介绍一下机器翻译中的编码解码模型,因为图像描述的基础是机器翻译带来的灵感。在最原始