Image captioning数据集、评价指标和算法性能比较

Image captioning数据集、评价指标和算法性能比较

作者:安静到无声 个人主页

目录

    • Image captioning数据集、评价指标和算法性能比较
      • 1 数据集
      • 2. 评价指标
      • 3.算法性能比较
    • 推荐专栏

1 数据集

基于深度学习的图像描述算法能够得到迅速发展,很大成度得益于大规模数据集的出现。数据集不仅是衡量和比较图像描述算法性能的重要依据,也是将图像描述算法推向越来越复杂、越来越具有实用性方向的强大动力。图像描述领域常见的数据集有Flickr8K、Flickr30K、MicrosoftCOCOCaption、VisualGenome、ConceptualCap‐tions、TextCaps、VizWiz-Captions、LocalizedNarra‐tives和FAshionCaptioningDataset。

  1. Flickr8K 数据集由 UIUC(University of Illinois at Urbana-Champaign)团队于2013年提出,该数据集图像主要包含人和动物等目标,共 8 000幅,其中训

你可能感兴趣的:(手把手实现Image,captioning,算法)