关于flickr的数据集笔记

  1. flickr8k图像标注数据集:
    1. 数据集包含8,000张图像,每张图像都与五个不同的标题配对,这些标题提供了对图片中物体和事件的内容描述
    2. 这个数据集好像和图像描述任务(给图像生成文本描述)有关。
    3. 图像字幕生成可使用的优秀数据集:flickr8k数据集,逼真且相对较小。
  2. Flickr30K是从Flickr中下载整理出的包含30k图片和对应描述句子的数据集
  3. IGEODATA数据集:
    1. 该数据集由十个bzip2压缩文件(yfcc100m_dataset-0.bz2到yfcc100m_dataset-9.bz2)组成,每个文件包含10M行,其中每行包含以下制表符分隔的字段:*照片/视频标识符、*用户NSID、*用户昵称、*拍摄日期、*上传日期、*捕获设备、*标题、*描述、*用户tags(逗号分隔)、*机器tags(逗号分隔)、*经度、*纬度、*准确性、*照片/视频页面URL、*照片/视频下载URL、*许可证名称、*许可证URL、*照片/视频服务器标识符、*照片/视频场标识符、*照片/视频机密、*照片/视频机密原件、*原始照片的扩展、*照片/视频标记(0=照片,1=视频)
    2. 包含自由格式文本的字段已经过URL编码。并非所有字段都有值,特别是相机、标题、描述、标记、EXIF、经度、纬度和精度字段可能为空。请注意,原始扩展名仅对照片有意义,而对视频没有意义(请检查视频的前几个字节以确定其文件格式)。
    3. 除了数据集文件外,还提供了一个包含照片/视频标识符及其相应MD5哈希(yfcc100m_hash.bz2)的文件。这些散列将用于外部托管的扩展包(例如功能、注释),作为间接层,以隐藏对照片/视频信息的直接访问。

你可能感兴趣的:(dataset,数据集)