faster-rcnn.pytorch-1.0指南(四)——训练自己的数据集

目录

  • faster-rcnn.pytorch-1.0指南(一)——序言
  • faster-rcnn.pytorch-1.0指南(二)——平台搭建和模型训练
  • faster-rcnn.pytorch-1.0指南(三)——制作PASCAL VOC2007数据集
  • faster-rcnn.pytorch-1.0指南(四)——训练自己的数据集

  在完成制作PASCAL VOC2007数据集后可以开始训练自己的数据集了。
  我这里用的例子是之前做的KITTI数据集目标检测——KITTI转VOC
一、修改参数
  首先,在faster-rcnn.pytorch/lib/datasets目录下的pascal_voc.py里更改自己的类别,'background’切记不可删掉,把后面的原来的20个label换成自己的,不用更改类别数目,也没有地方可以更改。
  faster-rcnn.pytorch-1.0指南(四)——训练自己的数据集_第1张图片
  第43行的图片格式默认为jpg,可以修改为自己数据库中的图片格式。
二、删除缓存
  由于我们之前用vgg16训练过原始的数据库,因此需要将以下目录中的缓存删除:

faster-rcnn.pytorch/output/vgg16/voc_2007_trainval/default
faster-rcnn.pytorch/data/cache
faster-rcnn.pytorch/data/VOCdevkit2007/annotations_cache

  若本来就没有生成以上目录,或者没有更换数据集,则无需删除。如果不删除这些这些缓存,会导致在更换数据集的时候各种规格不一致。
三、训练模型
   这里依旧以vgg16为例,指令具体含义在faster-rcnn.pytorch-1.0指南(二)——平台搭建和模型训练这一章有说明。

CUDA_VISIBLE_DEVICES=0 python trainval_net.py \
                   --dataset pascal_voc --net vgg16 \
                   --epochs 1 --bs 1 --nw 4 \
                   --lr  1e-3 --lr_decay_step 5 \
                   --cuda

faster-rcnn.pytorch-1.0指南(四)——训练自己的数据集_第2张图片
大概的结果和之前一样,不同的是这次是用自己的训练集。
四、Bug修正
  在运行指令的时候可能会出现一些问题如下

assert(boxes[:,2]>=boxes[:,0]).all()

  基本上都会碰上,只要是你标注的框靠近边缘,都会出这个错误,不用急,按照下面方法改,完美解决:
  修改lib/datasets/imdb.py,append_flipped_images()函数
  在一行代码为 boxes[:, 2] = widths[i] - oldx1 - 1下加入代码:

for b in range(len(boxes)):
	if boxes[b][2]< boxes[b][0]:
		boxes[b][0] = 0

你可能感兴趣的:(Pytorch,深度学习攻略)