1.数据获取
此部分不做过多阐述,因人而异。
可以在网站上爬取特定的图片,也可以在宝打包购买。
Note:搜集到的数据应该尽可能保持同一规格,例如图片尺寸,分辨率等,方便后续设定统一的超参数。
2.数据标记
标记工具:
1.https://github.com/tzutalin/labelImg
2.https://github.com/cgvict/roLabelImg
本人因数据集需要,在标记时使用了工具2中的旋转框进行标注,一般情况下标注水平框足矣。
Note:标注时Ground Truth尽量不要贴近图像边缘。
3.数据转化
标注图像选用了上述工具2中的旋转框,在faster-rcnn中因为都是水瓶框,旋转框的表述格式不被允许,将旋转框转为水平框形式。在此步的转化流程为将voc旋转框格式转化为dota数据集格式,再将dota数据集格式转化为voc水平框形式。
参考转化博客:
voc2yolo:yolov3 制作voc数据格式:xml转换成txt_WK785456510的博客-CSDN博客_voc转txt
dota2voc:将DOTA标签格式转为VOC格式形成xml文件_Mr_health的博客-CSDN博客
4.VOC数据集形式
此部分可搜索资料很多,不再阐述。