数据集共有8240张图像。分为 32类logos。且均具有较为平坦的表面。
Adidas,Aldi, Apple, Becks, BMW, Carlsberg, Chimay, Coca-Cola, Corona, DHL,
Erdinger,Esso, Fedex, Ferrari, Ford, Fosters, Google, Guiness, Heineken, HP,
Milka,Nvidia, Paulaner, Pepsi, Ritter Sport, Shell, Singha, Starbucks, Stella Artois,Texaco,
Tsingtao,UPS.
8240张图像分为三个子集:
训练集P1:手动挑选。每类10张。P1共320张。
验证集P2:至少含有一个logo的图像,每类30张,共960张。
不含logo的图像。3000张。
测试集P3:至少含有一个logo的图像,每类30张,共960张。
不含logo的图像。3000张。
下载的压缩包:
文件夹‘classes’:
‘jpg’:32个文件夹分别包含32种logo的图像。
每个logo有70张图像。大小不一。
‘masks’:二进制的mask。和原图相同大小。
标志区域为白色255。其他位置为黑色0。
logo的mask是
n是mask的计数。因为有的图像中含有两个logo。因此后来加入xxxx.jpg.mask.merged.png
每个有logo的图像有对应的xxxxx.jpg.bboxes.txt文件,记录了boundingbox的位置。
e.g x y width height
213 1 270 195
‘thumbnails’:jpg文件夹中图像的缩略图。大小100*75。
xx.filenames.txt:对应子集或全集的所有图像名字。xxx.jpg
xx.relpaths.txt:对应子集或全集的所有图像路径。e.g:classes/jpg/google/462663740.jpg
xx.spaces.txt:对应子集或全集的类和图像名字。e.g:google 462663740.jpg
xx.txt: e.g:google,462663740.jpg
xx指:全集(all)、训练集(train)、验证集(valset)、测试集(testset)、
含logo的验证集(valset-logosonly)、不含logo的验证集(valset-nologos.filenames)、
含logo的测试集(testset-logosonly)、不含logo的测试集(testset-nologos.filenames)。
信息整合自:http://www.multimedia-computing.de/flickrlogos/
压缩包中的README文件
参考paper:Romberg S, Pueyo L G, Lienhart R, et al. Scalable logo recognition in real-world images.