数据集地址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
Caltech-UCSD Birds-200-2011 (CUB-200-2011) 是 CUB-200 dataset 的一个扩充版本,每个类的图像数量大约增加两倍和新的部位注释。
(1)类别数目: 200
(2)图像总数目: 11,788
(3)每张图片的标注信息: 15 Part Locations, 312 Binary Attributes, 1 Bounding Box
该数据集是细粒度图像分类最广泛使用的基准。该数据集涵盖了 200 种鸟类,其中包括 5994 张训练图像和 5794 张测试图像。除类别标签外,每个图像都会用 1 个边界框、15 个零件关键点和 312 个属性进行进一步注释。
数据集地址:http://vision.stanford.edu/aditya86/ImageNetDogs/
斯坦福狗数据集:训练数据为 120 个品种狗狗的照片,共 10222 张。共 10357 张测试样本。它是 ImageNet 数据集的之类,可以用作细粒度分类。
相关竞赛:https://www.kaggle.com/c/dog-breed-identification
数据集地址:https://ai.stanford.edu/~jkrause/cars/car_dataset.html
数据集组成:包含 196 种车辆的 16,185 张照片;其中训练集 8144,测试集 8041;
关键特征包括:车辆制造商、款式、生产日期(比如:2012 Tesla Model S);
相关论文:3D Object Representations for Fine-Grained Categorization,Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
数据集地址:http://www.robots.ox.ac.uk/~vgg/data/flowers/102/index.html
数据集由 102 类产自英国的花卉组成。每类由 40-258 张图片组成。总共 8189 张 jpg 图片
相关竞赛:https://www.kaggle.com/wassimseifeddine/102flowersdataset
数据集地址:http://www.robots.ox.ac.uk/~vgg/data/fgvc-aircraft/
数据集包含 10,200 架飞机的图像,其中 102 种不同飞机,每一种都具有 100 张图像。数据集按照四个层级结构进行划分,从细到粗分别是:
相关论文:Fine-Grained Visual Classification of Aircraft https://arxiv.org/abs/1306.5151
DeepFashion 是香港中文大学开放的一个 large-scale 数据集。包含 80 万张图片,包含不同角度,不同场景,买家秀,买家秀等图片。
每张图片也有非常丰富的标注信息,包括 50 种类别,1000 种属性,Bbox,特征点。
还有约 30 万的不同姿势 / 不同场景的图片 pairs。
数据集地址:http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html
数据集地址:https://rpc-dataset.github.io/
RPC 数据集是旷视南京研究院发布了一个新零售自动结算场景下的大型商品数据集,无论商品类别(达 200)还是图像总量(达 83k)均是目前该领域之最。
相关链接:https://zhuanlan.zhihu.com/p/55627416