faster rcnn(pytorch)代码复现记录

最近在学习计算机视觉,记录一下一个小白学习faster rcnn 的过程。
复现代码链接:https://github.com/ruotianluo/pytorch-faster-rcnn
复现环境:ubuntu18.04+pytorch1.3,GPU使用1080Ti。

一、利用预训练模型的测试图片

1、首先按照链接的要求,下载代码。
git clone https://github.com/ruotianluo/pytorch-faster-rcnn.git
2、下载数据集

我是在VOC2012数据集上进行测试,已经提前下载了VOC2012数据集。
然后在根目录下创建一个data文件夹,然后建立软链接来指向数据集的位置,方法如下:

cd $FRCN_ROOT/data
ln -s $VOCdevkit VOCdevkit2012

软链接的使用方法为:ln -s 源文件 链接名

例如我的数据集源文件存放的位置为/media/qujiangang/study/PycharmProjects/datatset/VOC_data/datasets/VOCdevkit;链接名为VOCdevkit2012
创建完成后如图所示,会出现一个链接的符号连到源数据的位置。
faster rcnn(pytorch)代码复现记录_第1张图片

3、下载预训练模型

按照链接上的要求需要在Google云盘上下载,此处需要下载。

4、创建预训练模型软链接

与第二步创建软链接的方法类似,将下载的与训练模型解压,并放到data/voc_2007_trainval+voc_2012_trainval文件夹下,利用相同的方法创建软链接。

NET=vgg16
TRAIN_IMDB=voc_2007_trainval+voc_2012_trainval
mkdir -p output/${NET}/${TRAIN_IMDB}
cd output/${NET}/${TRAIN_IMDB}
ln -s ../../../data/voc_2007_trainval+voc_2012_trainval ./default
cd ../../..

创建好后的default文件夹指向预训练模型。
faster rcnn(pytorch)代码复现记录_第2张图片

5、测试图片

在终端输入下列命令即可

GPU_ID=0
CUDA_VISIBLE_DEVICES=${GPU_ID} ./tools/demo.py

在运行的过程中可能会出现一些缺少包的问题,安装重新运行即可。

我还出现了从SciPy中导入imresize失败的情况,如图所示。通过查找资料得知,imresize已经被最新版本的SciPy库所弃用,而自己报错的Python环境的SciPy库版本为1.3.0,这也正是出现上述问题的原因
faster rcnn(pytorch)代码复现记录_第3张图片解决方法有两种:
a、用numpy来实现

from PIL import Image
import numpy as np

# im = imresize(im, (h, int(w * aspect_ratio)), interp='bicubic')
im = np.array(Image.fromarray(im).resize((h, int(w * aspect_ratio))))

b、把SciPy版本降低

pip install scipy==1.1.0
6、结果

faster rcnn(pytorch)代码复现记录_第4张图片

二、训练自己的模型

1、下载vgg16预训练模型

faster rcnn(pytorch)代码复现记录_第5张图片

你可能感兴趣的:(目标检测)