python验证码识别(windows适用)

验证码识别需要的库pytesseract,说白了就是调用别人的东西!!!

依赖PIL及tesseract-ocr,PIL是python 的一个库,但是tesseract-ocr是一个需要安装的软件,百度一下安装后应该会自动配置环境变量。

简单测试一下,cmd-》tesseract vode.png result,之后会将验证码保存在一个result.txt的文件中。

然后上代码:

import pytesseract
from PIL import Image
import os
f = os.getcwd()
ff = os.path.normpath(f+'\\vcode.gif')
image = Image.open(ff)
vode = pytesseract.image_to_string(image)
print(vode)

但是在windows下,你会发现:FileNotFoundError: [WinError 2] 系统找不到指定的文件。

python验证码识别(windows适用)_第1张图片

其实还是cmd的锅,因为那个环境变量没卵用,我们根据目录打开pytesseract.py

#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

把原来打不开的改成我们自己电脑上的路径,然后save,问题解决!

python验证码识别(windows适用)_第2张图片

你可能感兴趣的:(python)