当运行 demo.py 有如上输出时, 说明我们已经可以通过之前别人训练好的模型进行测试, 下面我们将自己动手训练一个模型。该模型数据采用 voc2007 数据。训练时采用 ZF 模型。
1 训练模型需要修改的部分:
data —> 存放数据,以及读取文件的 cache
models —> 三种模型, ZF(S)/VGG1024(M)/VGG16(L)
lib —> python 接口
2 下载训练、测试数据集并解压
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
建议在 Windows 上下载,将数据放到~/ work 目录下并解压。
$ tar xvf VOCtrainval_06-Nov-2007.tar
$ tar xvf VOCtest_06-Nov-2007.tar
$ tar xvf VOCdevkit_08-Jun-2007.tar
3 建议给 voc2007 建立一个供 faster-rcnn 使用的软连接。
这样当你建立其他工程需要使用 voc2007
数据时,同样只需要建立一个软连接即可。
$ cd ~/work
$ cp -r ~/software/caffe/py-faster-rcnn/ ./
$ ln -s VOCdevkit py-faster-rcnn/data/VOCdevkit2007
:
4 修改相应代码
在训练之前,由于 ubuntu16.04 安装的 numpy 是 1.13.0 版本,而 py-faster-rcnn 代码使用的
numpy1.11.0,因此还需要修改相应代码,如下:
$ vim ~/work/py-faster-rcnn/lib/roi_data_layer/minibatch.py
修改第 55 行为:
for im_i in xrange(num_images):
labels, overlaps, im_rois, bbox_targets, bbox_inside_weights
= _sample_rois(roidb[im_i], int(fg_rois_per_image),
int(rois_per_image),int(num_classes))
int(num_classes))
修改第 98 行为:
if fg_inds.size > 0:
fg_inds = npr.choice(
fg_inds, size=int(fg_rois_per_this_image), replace=False)
修改第 110 行为:
if bg_inds.size > 0:
bg_inds = npr.choice(
bg_inds, size=int(bg_rois_per_this_image), replace=False)
修改第 124 行为:
bbox_targets, bbox_inside_weights = _get_bbox_regression_labels(
roidb['bbox_targets'][keep_inds, :], int(num_classes))
添加如下代码 175 行后:
start = int(start)
end = int (end)
这样不会有如下错误出现:
"TypeError: 'numpy.float64' object cannot be interpreted as an index"
5 开始训练
$ cd py-faster-rcnn
$ ./experiments/scripts/faster_rcnn_alt_opt.sh 0 ZF pascal_voc
出现错误:
ImportError: No module named _caffe
解决:重新编译一下pycaffe
出现错误:
from google.protobuf.internal import enum_type_wrapper
ImportError: No module named google.protobuf.internal
$ sudo pip install protobuf
还是同样的错误
切换root用户再执行,错误消失,又出新的错误:
File "__init__.pxd", line 989, in numpy.import_array
ImportError: numpy.core.multiarray failed to import
解决:
$ sudo pip install -U numpy
问题:
AssertionError: Path does not exist: /home/fc/py-faster-rcnn/data/VOCdevkit2007/VOC2007/ImageSets/Main/trainval.txt
解决 :
检查链接VOCdevkit2007并无问题,而且trainal.txt也存在。
最好直接删除VOCdevkit2007链接,把~/work下的VOCdevkit目录直接拷贝到py-faster-rcnn/data/下并更名为VOCdevkit2007
问题:
I0106 13:49:59.310015 19446 layer_factory.hpp:77] Creating layer input-data
Traceback (most recent call last):
File "/home/fc/py-faster-rcnn/tools/../lib/roi_data_layer/layer.py", line 15, in
from roi_data_layer.minibatch import get_minibatch
File "/home/fc/py-faster-rcnn/tools/../lib/roi_data_layer/minibatch.py", line 53
labels, overlaps, im_rois, bbox_targets, bbox_inside_weights \
^
IndentationError: expected an indented block
解决:是python的缩进问题layerminibatch.py地53行往后缩进4个空格
$ vim ~/py-faster-rcnn/lib/roi_data_layerminibatch.py +53
问题:
SystemError: NULL result without error in PyObject_Call
解决:
$ sudo apt-get install python-yaml
问题:
F0106 14:03:13.176914 19648 io.cpp:54] Check failed: fd != -1 (-1 vs. -1) File not found: data/imagenet_models/ZF.v2.caffemodel
*** Check failure stack trace: ***
解决:
指明使用第一块 GPU(0),模型是 ZF,训练数据是 pascal_voc(voc2007),没问题的话应该可以迭代训练了。如果你之前有训练过,那需要把 py-faster-rcnn/data/cache/目录下的.pkl 删除或者备份。