参考Bolg:ILSVRC2015_VID数据集详解_lighten-1996的博客-CSDN博客_ilsvrc2015
数据主页:ImageNet Large Scale Visual Recognition Competition 2015 (ILSVRC2015)
数据下载:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz
目录
一、基本信息
二、压缩包详细结构
1.压缩包
2.压缩包解压后
3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets
3.1 Annotations
3.2 Data
3.3 ImageSets
数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。每个snippet包括56~458帧图像不等。
该数据集有30个基本类别:
n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20 rabbit 兔子
n02509815 21 red_panda 红熊猫
n02411705 22 sheep 羊
n01726692 23 snake 蛇
n02355227 24 squirrel 松鼠
n02129604 25 tiger 老虎
n04468005 26 train 火车
n01662784 27 turtle 海龟
n04530566 28 watercraft 船只
n02062744 29 whale 鲸鱼
n02391049 30 zebra 斑马
Annotations、Data、ImageSets内首先都是一个VID文件夹:
以下全是VID文件夹内的结构
Annotations为注解,主要是每帧图bbox的标注,有train和val两个文件夹:
所有的train类文件夹都被分为了0000,0001,0002,0003四个类别。
ILSVRC2015\Annotations\VID\train包含以下文件(全部文件):
每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例。
ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000文件夹内包含以下文件(部分文件):
每个文件夹中存放的是一个视频序列中每一帧的对应信息,以xml文件格式存储。
ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000内包含以下文件(部分文件):
000000.xml文件内容:每张图长宽像素值固定(1280 x 720),bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标。object表示一个跟踪对象,trackid表示当前跟踪对象的id,一帧可有多个object。
ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000
000000
1280
720
ILSVRC2015\Annotations\VID\val包含以下文件(部分文件):
ILSVRC2015\Annotations\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):
Data文件夹中存放的是对应视频和每帧图片:视频存放于snippets文件夹,snippets文件夹也分为test,train,val三个文件夹,存放对应视频格式(.mp4)。每帧图片分为test,train,val三个文件夹存放。
3.2.1 snippets
ILSVRC2015\Data\VID\snippets\test包含以下文件(部分文件):
ILSVRC2015\Data\VID\snippets\train包含以下文件(部分文件):
ILSVRC2015\Data\VID\snippets\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):
ILSVRC2015\Data\VID\snippets\val包含以下文件(部分文件):
3.2.2 test
ILSVRC2015\Data\VID\test\ILSVRC2015_test_00000000包含以下文件(部分文件):
3.2.3 train
ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):
ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000包含以下文件(部分文件):
3.2.4 val(部分文件)
ILSVRC2015\Data\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):
ImageSets文件夹存放帧数文件的记录。
ILSVRC2015\ImageSets\VID\包含以下文件(全部文件):