python opencv 验证码识别

1.前提条件

安装  python包opencv,Image,pytesseract
python版本需要3.x以上
为了加快速度,可以使用清华源
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple Image
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytesseract
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python

2.安装一个Tesseract-OCR软件。

这个软件是由Google维护的开源的OCR软件。
下载地址:

https://pan.baidu.com/s/1w5qjfrl2mNdX0ajuNde2CA
提取码:28fc

下载后双击tesseract-ocr-setup-4.00.00dev.exe进行安装,记住安装路径。
win10修改环境变量
添加环境变量TESSDATA_PREFIX,变量值是你安装Tesseract-OCR的目录,比如D:\tesseract\Tesseract-OCR\tessdata
python opencv 验证码识别_第1张图片
然后在path下添加%TESSDATA_PREFIX%\tesseract.exe
python opencv 验证码识别_第2张图片
保存环境变量,一般情况下需要重启电脑。

3.修改pytesseract.py

找到python的安装路径下的pytesseract.py文件

找到你python安装包的目录,找到pytesseract.py文件,比如:
python opencv 验证码识别_第3张图片
用编辑器打开,查找tesseract_cmd
将原来的 tesseract_cmd = ‘tesseract’ 改为: tesseract_cmd = ‘OCR的安装路径下的tessract.exe’
比如:
python opencv 验证码识别_第4张图片
那么tesseract_cmd 的路径修改如下:
在这里插入图片描述
配置成功,开始试验:

import pytesseract
from PIL import Image

image = Image.open('test2.png')
code = pytesseract.image_to_string(image)
print("result:")
print(code)

测试图片:
测试图片
实验结果:
python opencv 验证码识别_第5张图片

你可能感兴趣的:(python)