验证码识别需要的库pytesseract,说白了就是调用别人的东西!!!
依赖PIL及tesseract-ocr,PIL是python 的一个库,但是tesseract-ocr是一个需要安装的软件,百度一下安装后应该会自动配置环境变量。
简单测试一下,cmd-》tesseract vode.png result,之后会将验证码保存在一个result.txt的文件中。
然后上代码:
import pytesseract
from PIL import Image
import os
f = os.getcwd()
ff = os.path.normpath(f+'\\vcode.gif')
image = Image.open(ff)
vode = pytesseract.image_to_string(image)
print(vode)
其实还是cmd的锅,因为那个环境变量没卵用,我们根据目录打开pytesseract.py
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'