Tesseract安装

Tesseract

安装

下载地址:https://github.com/UB-Mannheim/tesseract/wiki

遇到问题

载入语言失败 Failed loading language
明明eng.traineddata和chi_sim.traineddata都在“/usr/local/share/tessdata/”目录下
解决:后来发现文件大小不对,正常的文件都应该是几十M,重新下载替换文件即可
函数找不到 Error in findTiffCompression: function not present
正常安装了高版本的Leptonica,但还是报错函数找不到
解决:把Leptonia和tesseract都卸载了,再重新安装即可
验证:tesseract test.tif result.txt

参考代码

unittest目录下有各种例子~哦~

其他问题

1.tif和其他图片格式区别
2.box格式文件有什么作用
3.白底黑字有多少影响
4.测试识别性能
5.自己训练
6.训练结果合并
7.训练结果应用在移动端
8.可以拿到识别的匹配度
9.可以识别一行或者一个单词或者一个字母
10.不确定中文样式识别效果怎么样

你可能感兴趣的:(Tesseract安装)