----------下面步骤只在3.02中测试通过
环境:win7
1、下载所需工具:Tesseract3.02以及jTessBoxEditor
2、安装完成之后打开命令行,若Tesseract不起作用,请手动设置环境变量(若不会请绕行)
任意目录下新建目录:mylan,命令行中进入此目录,以下操作都在次目录中
3、Make Box Files:
tesseract card.arial.04.tif card.arial.04 batch.nochop makebox
----注意,此处命名可适当改动,但是若为:XX.tif容易出错。
4、Run Tesseract for Training:
tesseract card.arial.04.tif card.arial.04 nobatch box.train
5、Compute the Character Set:
unicharset_extractor cnlp.lpft.exp10.box
6、mftraining -F font_properties -U unicharset cnlp.lpft.exp10.tr
7、cntraining cnlp.lpft.exp10.tr
此步骤以后生成文件(生成的默认是没有“card.”前缀的,需手动添加):
8、生成语言包
combine_tessdata card.
9、done & Congratulation!