ILSVRC2015_VID数据集详解

数据集下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz

总说

数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。
每个snippet包括56~458帧图像不等。
视频中的目标检测,类似目标检测任务的风格。该任务有30个基本类别,是目标检测任务200个基本类别的子集。这些类别都是精心选择的,考虑到不同因素,如运动类型,视频背景干扰,平均目标数目等。所有类别在每个帧都完全打标签。
30个类别为:
n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20 rabbit 兔子
n02509815 21 red_panda 红熊猫
n02411705 22 sheep 羊
n01726692 23 snake 蛇
n02355227 24 squirrel 松鼠
n02129604 25 tiger 老虎
n04468005 26 train 火车
n01662784 27 turtle 海龟
n04530566 28 watercraft 船只
n02062744 29 whale 鲸鱼
n02391049 30 zebra 斑马


详解:

数据集下载并解压后,文件夹如图:
在这里插入图片描述
内含有Annotations Data ImageSets三个文件夹:
在这里插入图片描述

Annotations为注解,主要就是每帧图bndbox的标注,所有会有train和val两个文件夹
ILSVRC2015_VID数据集详解_第1张图片
所有的train类文件夹都被分为了0000,0001,0002,0003四个类别
ILSVRC2015_VID数据集详解_第2张图片
每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例
ILSVRC2015_VID数据集详解_第3张图片
每个文件夹中存放的是每一帧的对应信息,以.xml文件格式存储
ILSVRC2015_VID数据集详解_第4张图片
用浏览器打开后可看到具体存储信息,每张图长宽像素值固定,都是1280 x 720,bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标

Data文件夹中存放的是对应视频和每帧图片
视频存放于snippets文件夹,每帧图片分为test,train,val三个文件夹存放
ILSVRC2015_VID数据集详解_第5张图片
snippets文件夹也分为test,train,val三个文件夹存放对应视频(.mp4)格式

ImageSets文件夹存放主要是帧数文件的记录

部分借鉴于:https://blog.csdn.net/shenziheng1/article/details/81000883 在此表示感谢

你可能感兴趣的:(目标跟踪)