实践一:利用SSD-tensorflow训练kitti数据集

kitti数据集介绍

数据描述
KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。整个数据集由389对立体图像和光流图,39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成 ,以10Hz的频率采样及同步。总体上看,原始数据集被分类为 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,’Person_sitting’ ,’Misc’和 ‘Dontcare’。对于3D物体检测,label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc组成。
数据制作
为数据集设置2个类别, ‘Car’,’Pedestrian’,将 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,合并到 ‘Car’类别中去,将 ‘Person_sitting’合并到 ‘Pedestrian’类别中去(’Misc’和 ‘Dontcare’这两类直接忽略)
实践一:利用SSD-tensorflow训练kitti数据集_第1张图片

SSD代码测试

代码地址:https://github.com/balancap/SSD-Tensorflow
1 制作数据集
kitti图片总量是7481张,按照voc格式,把图片放在JPEGImages目录下,xml格式的文件放在Annotations目录下。
2 voc转tfrecords
voc格式的数据集制作好以后,我们需要把数据集转换成tfrecords
这里写图片描述
3,修改num_classes

4,进行训练
实践一:利用SSD-tensorflow训练kitti数据集_第2张图片

SSD-tensorflow存在问题

1,出现内存不足,需要将batch改为16
2,计算得到的损失结果一直在20左右摆动[调参均失败]

检测结果

SSD-tensorflow检测速度【显卡为1070】:44.068fps

你可能感兴趣的:(深度学习学习笔记,深度学习之图像处理)