编译MatCaffe
使用如下命令编译MatCaffe
make all matcaffe
之后,你可以用以下命令测试MatCaffe:
make mattest
如果你在运行上面命令时,遇到如下错误:libstdc++.so.6 version ‘GLIBCXX_3.4.15’ not found,说明你的Matlab库不匹配。你需要在启动Matlab之前运行如下命令:
export LD_LIBRARY_PATH=/opt/intel/mkl/lib/intel64:/usr/local/cuda/lib64
export LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libstdc++.so.6
在Caffe根目录启动Matlab之后需要增加路径:
addpath ./matlab
你可以使用savepath
来保存Matlab搜索路径,这样下次就不用再添加路径了。
使用MatCaffe
MatCaffe 和 PyCaffe 的使用方法很相似。
下面将用一个例子来解释MatCaffe的具体使用细节,假设你已经下载了BVLC CaffeNet,并且在caffe根目录启动matlab。
model = './models/bvlc_reference_caffenet/deploy.prototxt';
weights = './models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel';
1.设置模式和设备
模式和设备的设置必须在创建一个net或solver之前。
使用CPU:
caffe.set_mode_cpu();
使用GPU并指定gpu_id:
caffe.set_mode_gpu();
caffe.set_device(gpu_id);
2.创建一个网络并访问它的layers和blobs
1.创建网络
创建一个网络:
net = caffe.Net(model, weights, 'test'); % create net and load weights
或者
net = caffe.Net(model, 'test'); % create net but not load weights
net.copy_from(weights); % load weights
它可以创建一个如下的net对象:
Net with properties:
layer_vec: [1x23 caffe.Layer]
blob_vec: [1x15 caffe.Blob]
inputs: {'data'}
outputs: {'prob'}
name2layer_index: [23x1 containers.Map]
name2blob_index: [15x1 containers.Map]
layer_names: {23x1 cell}
blob_names: {15x1 cell}
两个containers.Map
对象可以通过layer或者blob的名称找到对应的索引。
2.访问blob
你可以访问网络中的每一个blob,将data
的blob填充为全一:
net.blobs('data').set_data(ones(net.blobs('data').shape));
将data
的blob中数值全部乘以10:
net.blobs('data').set_data(net.blobs('data').get_data() * 10);
注意:因为Matlab是以1作为起始单元,且以列为主,在Matlab中使用四维blob为[width, height, channels, num],且width是最快的维度,而且要在BGR通道。而且Caffe使用单精度浮点型数据。如果你的数据不是浮点型的,set_data
将会自动转换为single。
3.访问layer
你也可以访问网络的每一层,以便你作一些网络调整。例如把conv1
参数乘以10:
net.params('conv1', 1).set_data(net.params('conv1', 1).get_data() * 10); % set weights
net.params('conv1', 2).set_data(net.params('conv1', 2).get_data() * 10); % set bias
你也可以如下代码:
net.layers('conv1').params(1).set_data(net.layers('conv1').params(1).get_data() * 10);
net.layers('conv1').params(2).set_data(net.layers('conv1').params(2).get_data() * 10);
4.保存网络
你仅仅需要如下代码保存网络:
net.save('my_net.caffemodel');
5.获得一层的类型(string)
layer_type = net.layers('conv1').type;
3.前向和后向计算
前向和后向计算可以使用net.forward
或者net.forward_prefilled
实现。函数net.forward
将一个包含输入blob(s)的cell数组作为输入,并输出一个包含输出blob(s)的cell数组。函数net.forward_prefilled
将使用输入blob(s)中的已有数据进行计算,没有输入数据,没有输出数据。
在通过一些方法(如:data = rand(net.blobs('data').shape);
)产生输入数据后,你可以运行:
res = net.forward({data});
prob = res{1};
或者
net.blobs('data').set_data(data);
net.forward_prefilled();
prob = net.blobs('prob').get_data();
后向计算使用net.backward
或者net.backward_prefilled
,并且把get_data
和set_data
替换为get_diff
和set_diff
。在通过一些方法(例如prob_diff = rand(net.blobs('prob').shape);
)产生输出blobs的梯度后,你可以运行:
res = net.backward({prob_diff});
data_diff = res{1};
或者
net.blobs('prob').set_diff(prob_diff);
net.backward_prefilled();
data_diff = net.blobs('data').get_diff();
然而,如上的后向计算并不能得到正确的结果,因为Caffe默认网络不需要后向计算。为了获取正确的后向计算结果,你需要在你的网络prototxt文件中设置force_backward: true
在完成前向和后向计算之后,你可以获得中间blobs的data和diff。例如,你可以在前向计算后获取pool5
的特征。
4.Reshape
假设你想要运行1幅图像,而不是10幅时:
net.blobs('data').reshape([227 227 3 1]); % reshape blob 'data'
net.reshape();
然后,整个网络就reshape了,此时net.blobs('prob').shape
应该是[1000 1];
5.训练网络
假设你按照ImageNET Tutorial的方法创建了训练lmdb和验证lmdb,产生一个solver并且在ILSVRC 2012 分类数据集上训练:
solver = caffe.Solver('./models/bvlc_reference_caffenet/solver.prototxt');
这样可以创建一个solver
对象:
Solver with properties:
net: [1x1 caffe.Net]
test_nets: [1x1 caffe.Net]
训练代码:
solver.solve();
如果只想训练迭代1000次:
solver.step(1000);
来获取迭代数量:
iter = solver.iter();
来获取这个网络:
train_net = solver.net;
test_net = solver.test_nets(1);
假设从一个snapshot中恢复网络训练:
solver.restore('your_snapshot.solverstate');
6.输入和输出
caffe.io
类提供了基本的输入函数load_image
和read_mean
。例如,读取ILSVRC 2012 mean文件(假设你已经通过运行./data/ilsvrc12/get_ilsvrc_aux.sh
下载imagenet例程辅助文件)
mean_data = caffe.io.read_mean('./data/ilsvrc12/imagenet_mean.binaryproto');
为了读取Caffe例程图片,并且resize到[width, height],且假设width = 256; height = 256;
im_data = caffe.io.load_image('./examples/images/cat.jpg');
im_data = imresize(im_data, [width, height]); % resize using Matlab's imresize
注意:width
是最快的维度,通道为BGR,与Matlab存取图片的一般方式不一样。如果你不想要使用caffe.io.load_image
,且想自己导入一幅图片:
im_data = imread('./examples/images/cat.jpg'); % read image
im_data = im_data(:, :, [3, 2, 1]); % convert from RGB to BGR
im_data = permute(im_data, [2, 1, 3]); % permute width and height
im_data = single(im_data); % convert to single precision
你也可以看一下caffe/matlab/demo/classification_demo.m
文件,了解如何将输入图片crop成多个输入块。
你可以查看caffe/matlab/hdf5creation
,了解如何通过Matlab读和写HDF5数据。但不提供额外的数据输出函数,因为在Matlab本身已经具有了强大的功能。
7.清除nets和solvers
调用caffe.reset_all()
来清理你所创建的所有的solvers,和stand-alone nets。