手写体数字识别例子

  mnist是一个大型的手写体数字数据库,广泛应用于机器学习领域的训练和测试。mnist对每张图都已经进行尺寸归一化,固定尺寸28像素x28像素。
  下面开始手写体的简单例子测试caffe的安装情况。(注:未编译安装caffe请移步到我的博客:Ubuntu14.04下深度学习平台caffe的安装 文章)

1.下载mnist数据集

  mnist部分数据集可以在caffe根目录下data/mnist下用get_mnist.sh脚本下载。

$ cd data/mnist

$ ./get_mnist.sh

  下载好后可以看到4个数据文件。
手写体数字识别例子_第1张图片

2.转换格式

  下载到的原始数据集未二进制文件,文件格式可到mnist网站进行查询。caffe需要识别LEVELDB或LMDB,我们只需要在caffe根目录下执行

$ ./examples/mnist/create_mnist.sh

  浏览examples/mnist目录,发现生产了examples/mnist/mnist_train_lmdb/和examples/mnist/mnist_test_lmdb/两个目录, 每个目录下都有两个两个文件:data.mdb和lock.mdb
手写体数字识别例子_第2张图片
  mnist_train_lmdb是训练集,mnist_test_lmdb是测试集。
  让我们查看脚本的实现:

#!/usr/bin/env sh
# This script converts the mnist data into lmdb/leveldb format,
# depending on the value assigned to $BACKEND.
set -e

EXAMPLE=examples/mnist
DATA=data/mnist
BUILD=build/examples/mnist

BACKEND="lmdb"

echo "Creating ${BACKEND}..."

rm -rf $EXAMPLE/mnist_train_${BACKEND}
rm -rf $EXAMPLE/mnist_test_${BACKEND}

$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte $DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}
$BUILD/convert_mnist_data.bin $DATA/t10k-images-idx3-ubyte $DATA/t10k-labels-idx1-ubyte $EXAMPLE/mnist_test_${BACKEND} --backend=${BACKEND}

echo "Done."

上面脚本调用了bin/convert_mnist_data.bin这个可执行程序,对应源文件为examples/mnist/convert_mnist_data.cpp,有兴趣可自行查阅其实现。

3.训练超参数

  使用经典的LeNet-5模型进行训练,模型的描述文件为examples/mnist/lenet_train_val.prototext。
  运行example/mnist/train_lenet.sh脚本。先用vi打开改脚本,内容如下

#!/usr/bin/env sh
set -e
./build/tools/caffe train --solver=examples/mnist/lenet_solver.prototxt

  可见,调用了我们编译好的build/tools/caffe可执行文件,参数–solver=examples/mnist/lenet_solver.prototxt指定了训练超参数(Hyper-Parameter)文件。
  我们打开examples/mnist/lenet_solver.prototxt文件,其中

net: "examples/mnist/lenet_train_test.prototext"

一行定义了训练网络的描述文件。最后一行

solver_mode: CPU

指定了训练使用的模式,如果已经配置好CUDA,可以改为GPU。运行此脚本,等待训练完毕。(使用GPU模式在本人机器GT740M+i5 3230M上耗时5分钟,使用CPU模式大概为15-20分钟)

手写体数字识别例子_第3张图片
从图中可以看出,最后的训练分类准确率为99.08%,最终训练的模型权值保存早examples/mnist/lenet_iter_10000.caffemodel文件中训练状态则保存在examples/mnist/lenet_iter_10000.solverstate文件中。这两个文件都是ProtoBuffer二进制格式文件。

4.预测

  利用训练好的模型权值文件examples/mnist/lenet_iter_10000.caffemodel可以对测试数据集进行预测。运行如下命令

$ ./build/tools/caffe test -model examples/mnist/lenet_train_test.prototext -weights examples/mnist/lenet_iter_10000.caffemodel -itearations 100

  命令的参数解释:

  • ./build/tools/caffe test 表示只做预测(前向传播计算),不进行参数更新(反向传播计算)
  • -model examples/mnist/lenet_train_test.prototext 指定模型描述文本文件
  • -weights examples/mnist/lenet_iter_10000.caffemodel 指定预先训练好的权值文件
  • -itearations 100 指定迭代次数

执行命令后如图所示,得到预测结果。
手写体数字识别例子_第4张图片


  有兴趣可将自己手写体数字图片(缩放到28x28)送入训练得到的LeNet模型进行预测。

你可能感兴趣的:(deep-learning)