OCR样本训练

参考的tesseract-ocr训练方法 - zhanghaihua415的日志 - 网易博客

但是照着弄出现了几个问题

1.在他的第四步步骤的时候

4.Run Tesseract for Training。输入命令:

E:\Tesseract-ocr\tesseract.exe orderNo.tif orderNo nobatch box.train

发现命令错误,需要去掉nobatch就正确了。

2.在他的第六步步骤的时候

6.新建文件“font_properties”。如果是3.01版本,那么需要在目录下新建一个名字为“font_properties”的文件,并且输入文本 :

orderNo 0 0 0 0 0

这个操作过后,执行下一步过后会报错。

网上查找各种方法后,发现改了下命名就可以了。然后从头开始弄了一次就好了,比如图片名,他的是 orderNo.tif 我改成了 xxx.xxx.exp0.tif 这种命名格式过后就可以了。具体照着他的方法命令错误不知道是不是这个原因,本人也不清楚。

你可能感兴趣的:(OCR样本训练)