Windows10安装使用tesseract_ocr及配置问题解决

基本思想:通过tesseract_ocr完成一项字符识别任务,和paddle_ocr做了对比后,分析本项目后试试tesseract_ocr效果

1、安装tesseract

Ubuntu

sudo apt-get install tesseract-ocr

Mac

brew install tesseract

Windows

tesseract 下载地址:https://digi.bib.uni-mannheim.de/tesseract/

Windows10安装使用tesseract_ocr及配置问题解决_第1张图片

 Windows10安装使用tesseract_ocr及配置问题解决_第2张图片

1.1  在安装的过程中,安装的路径一般是:
C:\Program Files\Tesseract-OCR,可以按照自己熟悉路径修改

2.2 然后一直点击next,直到下面下面这张图。此时可以勾选 Additional language data(download) 选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,比如可以选择math,英文,中文等。然后一路点击Next按钮即可

 Windows10安装使用tesseract_ocr及配置问题解决_第3张图片

2、配置环境变量

2.1 为了在全局使用方便,比如安装路径为:
D:\Tesseract-OCR,将该路径添加到环境变量的path中。

2.2  路径:高级系统设置——>环境变量——>系统变量中path路径——>将 D:\Tesseract-OCR 添加进去。

Windows10安装使用tesseract_ocr及配置问题解决_第4张图片

2.3 配置完成后在cmd中输入 tesseract -v,如果出现如下图所示,说明环境变量配置成功。

Windows10安装使用tesseract_ocr及配置问题解决_第5张图片

3、 终端出现的报错问题及解决方法

3.1 测试图片 test01.jpg

Windows10安装使用tesseract_ocr及配置问题解决_第6张图片

3.2 使用cmd 先到图片当前路径,然后使用tesseract命令进行测试

tesseract test.jpg result

这里我们调用了tesseract命令,其中第一个参数为图片名称,第二个参数result 为结果保存的目标文件名称。

3.3 输入上述代码回车后,出现了以下的报错提示.

Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

3.4 报错是意思是缺少环境变量 TESSDATA_PREFIX,导致无法加载任何语言,就不能初始化tesseract。解决的方法也很简单,在环境变量——>系统变量中添加TESSDATA_PREFIX,如下图:
注(地址复制时是右斜杠 “\”,但是需要改成 左斜杠"/" 符号,如下图划红线处)

Windows10安装使用tesseract_ocr及配置问题解决_第7张图片

 3.5 配置完成后,重新打开cmd,重新运行。

Windows10安装使用tesseract_ocr及配置问题解决_第8张图片

 3.6 测试数字识别

tesseract example.jpg stdout digits

 Windows10安装使用tesseract_ocr及配置问题解决_第9张图片

你可能感兴趣的:(机器视觉,ocr)