【Few Shot数据集】CUB-200-2011 鸟类

文章目录

  • 一、数据下载
  • 二、数据介绍
    • 3.1 图案示意
    • 3.2 标注属性

CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,共11788张图片,每张图片都标注了物体的框、关键点和属性类别,常被用于小样本细粒度图像分类或者检测任务中。

一、数据下载

官网下载:https://www.vision.caltech.edu/datasets/cub_200_2011/

百度云下载 链接: https://pan.baidu.com/s/1o60hA0qrupDjtMGPVCke3A 密码: u0sr

数据发布的论文下载: https://authors.library.caltech.edu/27452/1/CUB_200_2011.pdf

二、数据介绍

CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,通常用于小目标分类、检测等任务。
所有的图片都是注释了 bounding boxes, part locations, 和属性。
图像和标注都是手工进行的。
【Few Shot数据集】CUB-200-2011 鸟类_第1张图片
下载后,解压如上所示,包含3个文件夹,5个标签文档,和一个README说明文档。

  • images 文件夹 有200个子文件夹,每个文件夹存放着对应图像类别的图片
    【Few Shot数据集】CUB-200-2011 鸟类_第2张图片

  • parts 文件夹 存放着每个图像的关键点标注信息 ,包含了三个文件
    【Few Shot数据集】CUB-200-2011 鸟类_第3张图片

    • parts/parts.txt : 关键点种类以及对应的类别,每行格式为
    • parts/part_locs.txt : 包含了所有的关键点的标注,每行格式为
    • parts/part_click_locs.txt : 每一行对应于不同MTurk工作人员对特定图像中特定关键点的标注,每行格式为 (相当于不同人,对同一个点如翅膀,进行标注时,会存在一些偏差理解,这里把不同人的标注,甚至标注时间都记录下来了) 。
  • attributes 文件夹 放着标注的一些属性
    【Few Shot数据集】CUB-200-2011 鸟类_第4张图片

    • attributes/certainties.txt :确定的属性,代表着标注人员标注时对类别是否确定的信息,每行格式为 其中 0 代表看不见,1 代表猜测的,2 代表可能,4 代表确定
    • attributes/image_attribute_labels.txt : 图像感知属性标注。 is_present 表示这个属性是否存在
      -attributes/class_attribute_labels_continuous.txt : 类似Animals With Attributes数据集的格式,该文件包含200行和312个空格分隔列。每一行对应一个类(与classes.txt的顺序相同),每一列包含一个与一个属性对应的实数(与attributes.txt的顺序相同
  • images.txt 包含每张图片的名字以及对应的序列号, 每行格式为

  • train_test_split.txt 推荐的训练集和测试集划分,每行格式为

  • image_class_labels.txt 每张图片对应的类别,每行格式为

  • classes.txt 图像class类别以及对应的类别ID,每行格式为

  • bounding_boxes.txt 每张图像的物体框 ,每行格式为

3.1 图案示意

【Few Shot数据集】CUB-200-2011 鸟类_第5张图片

3.2 标注属性

标注的关键点和属性,15个关键点(喙眼头背等),28个属性组(喙的形状、颜色、长等、背部有颜色,有图案等)
见下图【Few Shot数据集】CUB-200-2011 鸟类_第6张图片

【Few Shot数据集】CUB-200-2011 鸟类_第7张图片

你可能感兴趣的:(公开数据集,计算机视觉,人工智能,深度学习)