kaggle图像比赛中的submission文件格式解析

Severstal: Steel Defect Detection比赛为例,

https://www.kaggle.com/c/severstal-steel-defect-detection/data

里面的一部分说明如下:

In this competition you will be predicting the location and type of defects found in steel manufacturing. Images are named with a unique ImageId. You must segment and classify the defects in the test set.

Each image may have no defects, a defect of a single class, or defects of multiple classes. For each image you must segment defects of each class (ClassId = [1, 2, 3, 4]).

 

意思就是:

这个比赛的锈斑种类有四种,所以你会看到train.csv

每个图片的名称都被复制了四次:

0002cc93b.jpg_1

0002cc93b.jpg_2

0002cc93b.jpg_3

0002cc93b.jpg_4

分别代表每种锈斑

然后右侧让你写出像素的坐标.

 

train.csv的一部分.

kaggle图像比赛中的submission文件格式解析_第1张图片

 

至于为啥训练文件有两个呢?

train_images.zip和train.csv

这是因为其实我们自己都很难分清楚到底是那种锈斑:

kaggle图像比赛中的submission文件格式解析_第2张图片

所以train.csv就是来帮我们辨认的.

你可能感兴趣的:(kaggle图像比赛中的submission文件格式解析)