Caffe(4)--MobileNets实现,使用自定义数据集进行训练

论文地址:V1,https://arxiv.org/abs/1704.04861;V2,https://arxiv.org/abs/1801.04381

模型实现:Caffe框架(非官方)https://github.com/shicai/MobileNet-Caffe

1、下载模型
https://github.com/shicai/MobileNet-Caffe
下载得到MobileNets的Caffe实现,其中分别包含V1、V2的模型结构文件.prototxt和训练好的模型文件.caffemodel,还有测试脚本eval_image.py。
Caffe(4)--MobileNets实现,使用自定义数据集进行训练_第1张图片

2、模型测试
在下载得到的文件夹目录下执行以下命令:

python eval_image.py --proto mobilenet_deploy.prototxt --model mobilenet.caffemodel --image ./cat.jpg

输出如下:
Caffe(4)--MobileNets实现,使用自定义数据集进行训练_第2张图片

对于V2模型使用以下命令:

python eval_image.py --proto mobilenet_v2_deploy.prototxt --model mobilenet_v2.caffemodel --image ./cat.jpg

3、使用自定数据集训练MobileNet(使用cifar-10)
(1)修改训练模型文件
保存deploy.prototxt 文件为mobilenet_train.prototxt,并修改。
1)删除前5行input/input_dim内容,增加Data层如下:

layer {
  name: "cifar"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    mean_file: "/caffe/examples/cifar10/mean.binaryproto" //根据自己路径修改
  }
  data_param {
    source: "/caffe/examples/cifar10/cifar10_train_lmdb" //根据自己路径修改
    batch_size: 100
    backend: LMDB
  }
}

2)删除最后的prob层,增加Loss和Accuracy层:

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "fc7"
  bottom: "label"
  top: "loss"
}
layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "fc7"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}

3)修改最后输出层的通道数
因为cifar-10为10分类,修改为num_output: 10

4)修改BN的use_global_stats
训练时要把BN的use_global_stats改为false,它表示是否使用caffe内部的均值和方差,不然训练的时候会报nan或者模型不收敛,测试的时候改为true

(2)准备训练文件
在Caffe根目录下新建文件夹examples/mobilenets
examples/cifar10下的cifar10_quick_solver.prototxt、cifar10_quick_solver_lr1.prototxt、train_quick.sh三个文件复制过来,并修改文件名为mobilenet,如下所示:
Caffe(4)--MobileNets实现,使用自定义数据集进行训练_第3张图片

三个文件中对应文件名也做出相应修改:
Caffe(4)--MobileNets实现,使用自定义数据集进行训练_第4张图片

(3)开始训练
Caffe根目录下执行:

./examples/mobilenets/train_mobilenet.sh

Caffe(4)--MobileNets实现,使用自定义数据集进行训练_第5张图片

你可能感兴趣的:(Deep,Learning,Caffe,Caffe学习笔记)