1.数据库下载:http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html
2.字符库解压:先zip解压,再gnt解压:http://blog.csdn.net/zsjhxl/article/details/42294591
路径要进行改动,分测试集和训练集,桌面大小要够要有6GB大小,其余盘会出现编码问题
测试集属性(1241-1300共60项解压,花费半小时):
一共3755个文件夹,每个文件夹有59个png格式图,每张图大小5kb左右,共1.2G
训练集属性(1001-1240共240项解压,花费1.5小时):
一共3755个文件夹,每个文件夹有约239个png格式图,每张图大小5kb左右,共4.8G左右
3.对解压后的测试集和训练集文件夹分别进行重命名(标签,要一一对应):从1开始:http://blog.csdn.net/hubai789/article/details/49926019
4.在主文件夹/caffe-master下,新建项目文件夹jaylee,将测试和训练集放入
5.在jaylee下,新建run文件夹(目的是放入lmdb格式训练测试数据和prototxt文件)
6.把源数据变成caffe支持的lmdb格式及txt分类标签文件:
http://blog.csdn.net/liuweizj12/article/details/52149743
(1)标签文件生成
结合:https://zhidao.baidu.com/question/239930181433226844.html 和python中的for循环进行代码修改
(2)lmdb生成
vi命令:
:w写文件
dd删除一行空行
delete删除闪光标所在数据
A在当前行尾部加内容
I:游标后插入内容
ESC + i + enter 回车换行
:wq 保存并退出
O:实现插入模式下换行并新建一行
echo $PATH 查看系统路径
sudo gedit编辑文件方便
ubuntu 环境变量改错导致所有命令用不了:http://blog.csdn.net/qq_27099437/article/details/48627617
locate定位
数据是灰度图
生成train_lmdb 7.4G test_lmdb 1.8G
调用convert_imageset命令:
* cd 到train , test同层文件目录
* convert_imageset --resize_width=40 --resize_height=40 【文件路径名到class文件 上一层】 【txt描述文件名】【lmdb文件名】
* convert_imageset --gray=true --resize_width=40 --resize_height=40 /home/leospring/caffe-master/.build_release/teachExample/3/test/ ./t_test.txt ./t_test_lmdb
到此数据准备就结束了,接下来就需要调整网络和参数