基于caffe和casiaHWDB手写体汉字库的LMDB数据准备

1.数据库下载:http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html

2.字符库解压:先zip解压,再gnt解压:http://blog.csdn.net/zsjhxl/article/details/42294591

路径要进行改动,分测试集和训练集,桌面大小要够要有6GB大小,其余盘会出现编码问题

测试集属性(1241-1300共60项解压,花费半小时):

一共3755个文件夹,每个文件夹有59个png格式图,每张图大小5kb左右,共1.2G 

训练集属性(1001-1240共240项解压,花费1.5小时)

一共3755个文件夹,每个文件夹有约239个png格式图,每张图大小5kb左右,共4.8G左右 

附永久删除文件方法:
rm -rf 目录名字
-r 就是向下递归,管理有多少级目录,一并删除
-f 就是直接强行删除,不作任何提示的意思

3.对解压后的测试集和训练集文件夹分别进行重命名(标签,要一一对应):从1开始:http://blog.csdn.net/hubai789/article/details/49926019

4.在主文件夹/caffe-master下,新建项目文件夹jaylee,将测试和训练集放入

5.在jaylee下,新建run文件夹(目的是放入lmdb格式训练测试数据和prototxt文件)

6.把源数据变成caffe支持的lmdb格式及txt分类标签文件

http://blog.csdn.net/liuweizj12/article/details/52149743

(1)标签文件生成

结合:https://zhidao.baidu.com/question/239930181433226844.html 和python中的for循环进行代码修改

(2)lmdb生成

vi命令:

:w写文件

dd删除一行空行

delete删除闪光标所在数据

A在当前行尾部加内容

I:游标后插入内容

 ESC + i + enter 回车换行

:wq 保存并退出

O:实现插入模式下换行并新建一行

echo $PATH 查看系统路径

sudo gedit编辑文件方便

ubuntu 环境变量改错导致所有命令用不了:http://blog.csdn.net/qq_27099437/article/details/48627617

locate定位

例子:将目录A重命名为B  mv A B
文件夹出现闪退:可以卸载文件管理器 Nautilus后( sudo apt-get remove nautilus)重装(https://imcn.me/html/y2014/20156.html),然后将文件管理器移到桌面


编译caffe-master,"-j8"是使用CPU的多核进行编译,可以极大地加速编译的速度,建议使用。
 改动完caffe要 make clean
  $ make all -j8
    $ make test -j8
    $ make runtest -j8

数据是灰度图

生成train_lmdb 7.4G test_lmdb 1.8G


调用convert_imageset命令:
 * cd 到train , test同层文件目录
    * convert_imageset --resize_width=40 --resize_height=40 【文件路径名到class文件 上一层】 【txt描述文件名】【lmdb文件名】
    * convert_imageset           --gray=true           --resize_width=40          --resize_height=40        /home/leospring/caffe-master/.build_release/teachExample/3/test/            ./t_test.txt           ./t_test_lmdb

到此数据准备就结束了,接下来就需要调整网络和参数




你可能感兴趣的:(caffe,HWDB,LMDB)