ILSVRC2015_VID数据集说明

参考Bolg:ILSVRC2015_VID数据集详解_lighten-1996的博客-CSDN博客_ilsvrc2015

数据主页:ImageNet Large Scale Visual Recognition Competition 2015 (ILSVRC2015)

数据下载:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz

目录

一、基本信息

二、压缩包详细结构

1.压缩包

2.压缩包解压后

3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets

3.1 Annotations

3.2 Data

3.3 ImageSets

一、基本信息

数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。每个snippet包括56~458帧图像不等。

该数据集有30个基本类别:

n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20 rabbit 兔子
n02509815 21 red_panda 红熊猫
n02411705 22 sheep 羊
n01726692 23 snake 蛇
n02355227 24 squirrel 松鼠
n02129604 25 tiger 老虎
n04468005 26 train 火车
n01662784 27 turtle 海龟
n04530566 28 watercraft 船只
n02062744 29 whale 鲸鱼
n02391049 30 zebra 斑马

二、压缩包详细结构

1.压缩包

2.压缩包解压后

3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets

Annotations、Data、ImageSets内首先都是一个VID文件夹:

ILSVRC2015_VID数据集说明_第1张图片

ILSVRC2015_VID数据集说明_第2张图片

ILSVRC2015_VID数据集说明_第3张图片

以下全是VID文件夹内的结构

3.1 Annotations

Annotations为注解,主要是每帧图bbox的标注,有train和val两个文件夹:

ILSVRC2015_VID数据集说明_第4张图片

所有的train类文件夹都被分为了0000,0001,0002,0003四个类别。

ILSVRC2015\Annotations\VID\train包含以下文件(全部文件):

ILSVRC2015_VID数据集说明_第5张图片

每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例。

ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000文件夹内包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第6张图片

每个文件夹中存放的是一个视频序列中每一帧的对应信息,以xml文件格式存储。

ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000内包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第7张图片

000000.xml文件内容:每张图长宽像素值固定(1280 x 720),bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标。object表示一个跟踪对象,trackid表示当前跟踪对象的id,一帧可有多个object。表示物体是否被遮挡,如果为 0 表示图像中物体未被遮挡,为 1 表示当前物体被某些物体遮挡住。



    ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000
    000000
    
        ILSVRC_2015
    
    
        1280
        720
    
    
        0
        n01674464
        
            1050
            323
            428
            216
        
        1
        0
    

ILSVRC2015\Annotations\VID\val包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第8张图片

ILSVRC2015\Annotations\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第9张图片

3.2 Data

Data文件夹中存放的是对应视频和每帧图片:视频存放于snippets文件夹,snippets文件夹也分为test,train,val三个文件夹,存放对应视频格式(.mp4)。每帧图片分为test,train,val三个文件夹存放。

ILSVRC2015_VID数据集说明_第10张图片

3.2.1 snippets

ILSVRC2015_VID数据集说明_第11张图片

ILSVRC2015\Data\VID\snippets\test包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第12张图片

ILSVRC2015\Data\VID\snippets\train包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第13张图片

ILSVRC2015\Data\VID\snippets\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第14张图片

ILSVRC2015\Data\VID\snippets\val包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第15张图片

3.2.2 test

ILSVRC2015_VID数据集说明_第16张图片

ILSVRC2015\Data\VID\test\ILSVRC2015_test_00000000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第17张图片

3.2.3 train

ILSVRC2015_VID数据集说明_第18张图片

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第19张图片

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第20张图片

3.2.4 val(部分文件)

ILSVRC2015_VID数据集说明_第21张图片

ILSVRC2015\Data\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

ILSVRC2015_VID数据集说明_第22张图片

3.3 ImageSets

ImageSets文件夹存放帧数文件的记录。

ILSVRC2015\ImageSets\VID\包含以下文件(全部文件):

ILSVRC2015_VID数据集说明_第23张图片

你可能感兴趣的:(计算机视觉)