使用MXNet fine-tuning之GoogleNet

1.使用caffe中的GoogleNet模型进行fine-tuning
使用mxnet/tools/caffe_convert/convert_model.py进行模型和参数的转换:
python convert_model.py /path/GoogleNet.paramtxt /path/GoogleNet.caffemodel /path/googlenet
其中对于脚本convert_model.py,第一个参数是模型文件,第二个是参数文件,第三个是转换完以后的模型前缀。
交换次序会报错
2.转换好模型和参数以后会生成一个params文件和json文件,其中params文件是参数文件,json是模型文件。此外如果需要MXNet中网络结构的代码,可以使用mxnet/tools/caffe_convert/convert_symbol.py文件将model_name.paramtxt文件装换成相应的MXNet代码形式的网络模型:
python convert_symbol.py /path/GoogleNet.paramtxt /path/googlenet.py
会生成一个googlenet.py的网络结构文件。
3.转换好的网络模型,参数以及网络结构代码可以直接在MXNet程序中使用,需要注意的几点:
1).MXNet中最终输出层如果是Softmax layer,那么输出层的名字必须要使用softmax,否则系统会出现错误。
2).如果要修改原网络参数,需要使用不同的结构名字,例如在将网络直接应用到其他分类任务时需要修改输出层的num_hidden,改成数据集的种类数。如果只修改这一层隐藏神经元个数而不修改layer name则会报错。
直接转换的结果最后两层如下:
loss3_classifier = mx.symbol.FullyConnected(name='loss3_classifier ', data=flatten_0, num_hidden=397, no_bias=False)
prob = mx.symbol.SoftmaxOutput(name='prob ', data=loss3_classifier)
需要作如下修改
loss3_classifier = mx.symbol.FullyConnected(name='myfc', data=flatten_0, num_hidden=397, no_bias=False)
prob = mx.symbol.SoftmaxOutput(name='softmax', data=loss3_classifier)

你可能感兴趣的:(使用MXNet fine-tuning之GoogleNet)