Cityscapes数据集的介绍

一、下载链接

官网:https://www.cityscapes-dataset.com/, 官网也可以在benchmarks中查看大家神经网络达到的指标。
百度云:https://pan.baidu.com/s/1fsbavgeEWZnrCRZlRHoVNg#list/path=%2F, 需要解压gtFine.zip,没有包含coarse的标注(来自本博客)

二、数据集的结构特点

该大型数据集包含来自50个不同城市的街道场景中记录的多种立体视频序列,除了20000个弱注释帧以外,还包含5000帧高质量像素级注释。

Cityscapes dataset 的文件夹结构如下:(来自这篇博客)

 {root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext}

split可能出现的值:
train 通常用于训练, 包含 2975 张带有粗糙或精细标注的图像
val 应该用于验证hyper-parameters,包含500个具有精细和粗糙注释的图像。 也可以用于训练.
test 用于在我们的评估服务器上测试。 注释不公开,但为方便起见,我们包含自我车辆和整改边界的注释。有1525张。
train_extra 可以选择性地用于训练,包含带有粗略注释的19998张图像
demoVideo 可用于定性评估的视频序列,这些视频不提供注释

原图存放在leftImg8bit文件夹中,精细标注的数据存放在gtFine (gt : ground truth) 文件夹中 。其中训练集共2975张(train),验证集500张(val),都是有相应的标签的。但测试集(test)只给了原图,没有给标签,官方用于线上评估大家提交的代码(防止有人用test集训练刷指标)。因此,实际使用中可以用validation集做test使用。

标签文件中每张图像对应4个文件,其中_gtFine_polygons.json存储的是各个类和相应的区域(用多边形顶点的位置表示区域的边界);_gtFine_labelIds.png的值是0-33,不同的值代表不同的类,值和类的对应关系在代码中cityscapesscripts/helpers/labels.py中定义;_gtFine_instaceIds.png是示例分割的; _gtFine_color.png是给大家可视化的,不同颜色与类别的对应关系也在labels.py文件中说明。

可以使用Cityscapes的coarse标签做初步训练然后再用精细标签训练!(如这篇论文)

你可能感兴趣的:(数据集,深度学习,数据集)