图像描述模型综述参考

1、常用数据集

Flickr8K、Flickr30K:点击跳转
MS COCO:微软的 COCO 数据集中,有超过 160,000 的图像,人工为每张图像都至少撰写了 5 条标注,总共有超过 100 万句的描述。点击跳转
Visual Genome、SBU、Pascal Voc、
PASCAL-50S、ABSTRACT-50S

2、评价指标

BLEU:点击跳转
ROUGE:点击跳转
METEOR:点击跳转
CIDEr-D:点击跳转
Perplexity:

SPICE :这个指标是在 ECCV2016 上提出的,它基于句子对应的 semantic scene graphs 来评价 F-score,还是很科学的。点击跳转

3、循环神经网络

RNN
LSTM
GRU

4、应用

Show and Tell
Show,Attend and Tell
V2L
DenseCap
Mind’s Eye
Visual Concepts and Back

 

看的文章:

图像描述(image caption)历年突破性论文总结:点击跳转

demo 1 :点击跳转

Image caption——图像理解——看图说话综述(2015-2018):点击跳转

Image caption——图像理解——看图说话:点击跳转

Image Caption图像描述原理简介及实现:点击跳转

强化学习在图像描述中应用:点击跳转

【CV+NLP】更有智慧的眼睛:图像描述(Image Caption)&视觉问答(VQA)综述(上):点击跳转

2019年, image captioning论文汇总:点击跳转

图像描述(image caption)历年突破性论文总结:点击跳转

 

 

你可能感兴趣的:(❤️图像描述,图像处理)