验证码识别方式一:使用pytesseract实现验证码识别

验证码识别方式一:使用pytesseract实现验证码识别

  • 一、安装tesseract-ocr
    • 配置环境变量
  • 二、安装pytesseract
  • 三、使用pytesseract进行图像识别

一、安装tesseract-ocr

下载tesseract-ocr,并下一步、下一步默认安装

配置环境变量

将tesserct-orc的安装目录添加到环境变量
验证码识别方式一:使用pytesseract实现验证码识别_第1张图片

二、安装pytesseract

1.命令行安装pytesseract

pip install pytesseract

2.修改pytesseract.py文件
打开pytesseract.py,定位到其所在目录C:\Users\user\AppData\Local\Programs\Python\Python38-32\Lib\site-packages\pytesseract
修改tesseract安装路径

# tesseract_cmd = 'tesseract'
tesseract_cmd=r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

三、使用pytesseract进行图像识别

from PIL import Image
import pytesseract
def test(self):
    im1 = Image.open('abc.png')
    str=pytesseract.image_to_string(im1) #解析图片
    print(str) #打印图片文字

注:pytesseract只能识别不太复杂的验证码和标准文字图片

你可能感兴趣的:(selenium,python,图像识别)