Tesseract-OCR软件识别图片验证码[软件安装]

一、前言

Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
GitHub 地址:https://github.com/tesseract-...
安装包官方下载地址:https://digi.bib.uni-mannheim...
安装包百度云盘下载地址:https://pan.baidu.com/s/1AOsJ...

二、安装 Tesseract-OCR

直接执行下载好的 exe 文件,下一步、下一步默认安装即可。

三、配置环境变量

3.1 进入环境变量配置界面

右键点击此电脑--属性--高级系统设置--环境变量--系统变量--Path


Tesseract-OCR软件识别图片验证码[软件安装]_第1张图片
image.png
Tesseract-OCR软件识别图片验证码[软件安装]_第2张图片
image.png
Tesseract-OCR软件识别图片验证码[软件安装]_第3张图片
image.png

3.2 添加系统变量

找到系统变量的 Path ,将 Tesseract-OCR 的安装目录添加进去:

Tesseract-OCR软件识别图片验证码[软件安装]_第4张图片
image.png

3.3 添加 tessdata 系统变量

如下图新建系统变量 : TESSDATA_PREFIX
变量值为 tessdata 文件夹的路径(在Tesseract-OCR的安装目录下):

Tesseract-OCR软件识别图片验证码[软件安装]_第5张图片
image.png

四、使用 Tesseract-OCR

4.1 进入cmd 输入下面的命令查看版本,正常运行则安装成功:

tesseract --version
Tesseract-OCR软件识别图片验证码[软件安装]_第6张图片
image.png

4.2 使用下面命令识别图片

image.png
tesseract 图片路径 输出文件
image.png

查看输出的 result.txt文件:

image.png

结果正确!

你可能感兴趣的:(Tesseract-OCR软件识别图片验证码[软件安装])