BelgaLogos数据集分析


     BelgaLogos数据集含有自然场景的10000张图像,26种不同的logo(后来增至37种)和2771个logo实例,用边界框标注。

     所有图像均为JPEG格式,在保留各自宽高比的同时,大小调整为宽、高均不超过800像素。

     所有图像均已手动注释,提供了两种不同的groundtruth:Global groundtruth和Local groundtruth。

         Global groundtruth:

               每一张图对于26种不同的logos均被标注了0或者1。其中0表示该logo不存在在图像中,1反之。

               每一张图可能不含、含有一个或含有多个logos。logo的边界框若是小于10*10像素不被标注。只有queries图像提供了logos的定位。

    BelgaLogos数据集分析_第1张图片      

         Local groundtruth:

              37种不同的logos被矩形边界框标注。一张图像可能含有多个边界框。

BelgaLogos数据集分析_第2张图片

    Queries

          有三组:Qset1、Qset2、Qset3

           Qset1由55个组内查询(internalqueries)组成,每个组内查询由图像名称和此图像中logo的边界框坐标定义。

                    具有同一种logo(比如都是Adidas)的查询具有相同的根名称和迭代数(例如:Adidas1,Adidas2等)。

           Qset2由在Google查询'logo $logoname',从第一个结果页面下载的26个JPEG缩略图。

           Qset3由2697个组内查询组成,代表37个logos的所有“OK”实例,由图像名称和其中的logo边界框坐标定义。 

                    具有同一种logo(比如都是Adidas)的查询具有相同的根名称和迭代数(例如:Adidas1,Adidas2等)。

    评估

        评价指标:

           主要评价指标是查询集Qset1、Qset2或Qset3的所有查询的平均准确度(MeanAverage Precision)。先计算每个查询的平均准确度,然后计算整个查询集             的平均数。

            二级指标可以用来研究26个logos的具体表现。针对同一个logo,先计算每个查询的平均准确度,然后计算整个查询集的平均数。

         对于Qset1、Qset2,用trec eval评价

         对于Qset3,用BelGaLogosEval,利用实例的空间位置评价。      

     下载的压缩包

     images:10000张图像

     qset1_internal.qry: 组内查询集Qset1

            定义55个query。同一种logo有一个或多个实例。

            格式:    Instance_name    Image_name      X1  Y1  X2  Y2

                   e.g   Adidas1             07576336.jpg      286 796 354 853  

                          Adidas2             07681269.jpg      339 612 400 660 

                          Adidas3             07706745.jpg     333 760 450 840 

      qset1_internal.gt: Qset1的groundtruth

             用word打开共12501页。

             格式:Instance_name   0    Image_name    0/1

                          e.g   Adidas1  0     07568556.jpg     0

                                 Adidas2   0     07568556.jpg      0  

                                 Adidas3   0     07568556.jpg     0  

     qset2_external.qry: 组间查询集Qset2

            定义26个不同的logo种类

            格式:  Instance_name     Image_name

                  e.g  Adidas1                Adidas.jpeg         

                         Adidas-text1      Adidas-text.jpeg      

    qset2_internal.gt: Qset2的groundtruth

           用word打开共5910页。

           格式:  Instance_name   0    Image_name     0

                    e.g Adidas1           0      07568556.jpg       0  

                          Adidas1           0      07568557.jpg        0  

                          Adidas1           0       07568558.jpg       0   

     qset3_internal_and_local.qry: 组内和局部查询集Qset3

            格式:Instance_name   Logo_name     Image_name   Instance_type   Instance_state    X1  Y1   X2   Y2

                        e.g  Adidas_0000         Adidas              07686040.jpg         logo          1                       392  257  422  274  

                               Adidas_0001         Adidas               07706932.jpg         logo          1                       461  310  501  339 

                               Adidas_0002         Adidas               07698201.jpg         logo           1                       464  282  494  313 


                   以Adidas为例:instance_name:Adidas-0000- Adidas-1042,共1043个adidas实例

                                                Logo_name:Adidas

                                                Image_name:XXX.jpg

                                                Instance_type:logo

                                                Instancce_state: 其中147个实例被标记为“OK”--instancce_state=1

                                                                                 其它均被标记为“junk” --instancce_state=0

                                                X1  Y1     X2     Y2:logo的边界框

                      

      qset3_internal_and_local.gt: Qset3的groundtruth

             用word打开共229页。

             格式: Instance_name    Logo_name    Image_name   Instance_type   Instance_state     X1   Y1    X2    Y2

              e.g       Adidas_0000        Adidas           07686040.jpg            logo                     1                   392  257  422  274  

                         Adidas_0001         Adidas           07706932.jpg             logo                    1                   461  310  501  339  

                         Adidas_0002         Adidas           07698201.jpg             logo                    1                   464  282  494  313  

 

     qset3_internal_and_local.results: 作者提供的Qset3当时最好的结果

             用word打开共246页。

            格式:         Instance_name   Image_name    Retrieval_score     X1     Y1     X2     Y2

                        e.g   Adidas_0104      07638512.jpg        3.000000           428  288  432  295   

                                Adidas_0104      07638517.jpg        3.000000            327  287  334  297   

                                Adidas_0104      07638543.jpg        3.000000            338  256  342  261   

     BelgaLogosEval : Qset3的评价程序 

BelgaLogos数据集分析_第3张图片



     信息整合自:http://www-sop.inria.fr/members/Alexis.Joly/BelgaLogos/BelgaLogos.html

     参考paper:Joly A, Buisson O. Logo retrieval with a contrario visual query expansion.


     


你可能感兴趣的:(数据集分析)