BelgaLogos数据集含有自然场景的10000张图像,26种不同的logo(后来增至37种)和2771个logo实例,用边界框标注。
所有图像均为JPEG格式,在保留各自宽高比的同时,大小调整为宽、高均不超过800像素。
所有图像均已手动注释,提供了两种不同的groundtruth:Global groundtruth和Local groundtruth。
Global groundtruth:
每一张图对于26种不同的logos均被标注了0或者1。其中0表示该logo不存在在图像中,1反之。
每一张图可能不含、含有一个或含有多个logos。logo的边界框若是小于10*10像素不被标注。只有queries图像提供了logos的定位。
Local groundtruth:
37种不同的logos被矩形边界框标注。一张图像可能含有多个边界框。
Queries
有三组:Qset1、Qset2、Qset3
Qset1由55个组内查询(internalqueries)组成,每个组内查询由图像名称和此图像中logo的边界框坐标定义。
具有同一种logo(比如都是Adidas)的查询具有相同的根名称和迭代数(例如:Adidas1,Adidas2等)。
Qset2由在Google查询'logo $logoname',从第一个结果页面下载的26个JPEG缩略图。
Qset3由2697个组内查询组成,代表37个logos的所有“OK”实例,由图像名称和其中的logo边界框坐标定义。
具有同一种logo(比如都是Adidas)的查询具有相同的根名称和迭代数(例如:Adidas1,Adidas2等)。
评估
评价指标:
主要评价指标是查询集Qset1、Qset2或Qset3的所有查询的平均准确度(MeanAverage Precision)。先计算每个查询的平均准确度,然后计算整个查询集 的平均数。
二级指标可以用来研究26个logos的具体表现。针对同一个logo,先计算每个查询的平均准确度,然后计算整个查询集的平均数。
对于Qset1、Qset2,用trec eval评价
对于Qset3,用BelGaLogosEval,利用实例的空间位置评价。下载的压缩包
images:10000张图像
qset1_internal.qry: 组内查询集Qset1
定义55个query。同一种logo有一个或多个实例。
格式: Instance_name Image_name X1 Y1 X2 Y2
e.g Adidas1 07576336.jpg 286 796 354 853
Adidas2 07681269.jpg 339 612 400 660
Adidas3 07706745.jpg 333 760 450 840
qset1_internal.gt: Qset1的groundtruth
用word打开共12501页。
格式:Instance_name 0 Image_name 0/1
e.g Adidas1 0 07568556.jpg 0
Adidas2 0 07568556.jpg 0
Adidas3 0 07568556.jpg 0
qset2_external.qry: 组间查询集Qset2
定义26个不同的logo种类
格式: Instance_name Image_name
e.g Adidas1 Adidas.jpeg
Adidas-text1 Adidas-text.jpeg
qset2_internal.gt: Qset2的groundtruth
用word打开共5910页。
格式: Instance_name 0 Image_name 0
e.g Adidas1 0 07568556.jpg 0
Adidas1 0 07568557.jpg 0
Adidas1 0 07568558.jpg 0
qset3_internal_and_local.qry: 组内和局部查询集Qset3
格式:Instance_name Logo_name Image_name Instance_type Instance_state X1 Y1 X2 Y2
e.g Adidas_0000 Adidas 07686040.jpg logo 1 392 257 422 274
Adidas_0001 Adidas 07706932.jpg logo 1 461 310 501 339
Adidas_0002 Adidas 07698201.jpg logo 1 464 282 494 313
以Adidas为例:instance_name:Adidas-0000- Adidas-1042,共1043个adidas实例
Logo_name:Adidas
Image_name:XXX.jpg
Instance_type:logo
Instancce_state: 其中147个实例被标记为“OK”--instancce_state=1
其它均被标记为“junk” --instancce_state=0
X1 Y1 X2 Y2:logo的边界框
qset3_internal_and_local.gt: Qset3的groundtruth
用word打开共229页。
格式: Instance_name Logo_name Image_name Instance_type Instance_state X1 Y1 X2 Y2
e.g Adidas_0000 Adidas 07686040.jpg logo 1 392 257 422 274
Adidas_0001 Adidas 07706932.jpg logo 1 461 310 501 339
Adidas_0002 Adidas 07698201.jpg logo 1 464 282 494 313
qset3_internal_and_local.results: 作者提供的Qset3当时最好的结果
用word打开共246页。
格式: Instance_name Image_name Retrieval_score X1 Y1 X2 Y2
e.g Adidas_0104 07638512.jpg 3.000000 428 288 432 295
Adidas_0104 07638517.jpg 3.000000 327 287 334 297
Adidas_0104 07638543.jpg 3.000000 338 256 342 261
BelgaLogosEval : Qset3的评价程序
信息整合自:http://www-sop.inria.fr/members/Alexis.Joly/BelgaLogos/BelgaLogos.html
参考paper:Joly A, Buisson O. Logo retrieval with a contrario visual query expansion.