FlickrLogos-32数据集分析

   数据集共有8240张图像。分为 32类logos。且均具有较为平坦的表面。

   Adidas,Aldi, Apple, Becks, BMW, Carlsberg, Chimay, Coca-Cola, Corona, DHL,

   Erdinger,Esso, Fedex, Ferrari, Ford, Fosters, Google, Guiness, Heineken, HP,

   Milka,Nvidia, Paulaner, Pepsi, Ritter Sport, Shell, Singha, Starbucks, Stella Artois,Texaco,

   Tsingtao,UPS.

FlickrLogos-32数据集分析_第1张图片

   8240张图像分为三个子集:

        训练集P1:手动挑选。每类10张。P1共320张。

        验证集P2:至少含有一个logo的图像,每类30张,共960张。

                             不含logo的图像。3000张。

        测试集P3:至少含有一个logo的图像,每类30张,共960张。

                             不含logo的图像。3000张。

 

下载的压缩包:

   文件夹‘classes’:

       ‘jpg’:32个文件夹分别包含32种logo的图像。

                   每个logo有70张图像。大小不一。

       ‘masks’:二进制的mask。和原图相同大小。

                    标志区域为白色255。其他位置为黑色0。

                   /classes//.jpg里面有logo。

                    logo的mask是/masks//.mask..png。

                   n是mask的计数。因为有的图像中含有两个logo。因此后来加入xxxx.jpg.mask.merged.png

                    每个有logo的图像有对应的xxxxx.jpg.bboxes.txt文件,记录了boundingbox的位置。

                           e.g  x   y   width  height

                                213  1    270  195

             FlickrLogos-32数据集分析_第2张图片

       ‘thumbnails’:jpg文件夹中图像的缩略图。大小100*75。


     xx.filenames.txt:对应子集或全集的所有图像名字。xxx.jpg

     xx.relpaths.txt:对应子集或全集的所有图像路径。e.g:classes/jpg/google/462663740.jpg

     xx.spaces.txt:对应子集或全集的类和图像名字。e.g:google 462663740.jpg

     xx.txt:  e.g:google,462663740.jpg

       xx指:全集(all)、训练集(train)、验证集(valset)、测试集(testset)、

                  含logo的验证集(valset-logosonly)、不含logo的验证集(valset-nologos.filenames)、

                  含logo的测试集(testset-logosonly)、不含logo的测试集(testset-nologos.filenames)。



息整合自:http://www.multimedia-computing.de/flickrlogos/

                        压缩包中的README文件

参考paper:Romberg S, Pueyo L G, Lienhart R, et al. Scalable logo recognition in real-world images.

你可能感兴趣的:(数据集分析)