验证码识别 | tesseract库错误解决方案

 安装了Tesseract模块后识别验证码,却报以下错误:

FileNotFoundError: [WinError 2] 系统找不到指定的文件。

pytesseract.pytesseract.TesseractError: 
(2, 'Usage: python pytesseract.py [-l lang] input_file')

pytesseract.pytesseract.TesseractError: 
(1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata')

原因是该模块依赖于Tesseract-OCR,需要进行手动安装,下载地址如下:

 https://digi.bib.uni-mannheim.de/tesseract/

1、下载Tesseract-OCR

2、需要其加入到环境变量中:

验证码识别 | tesseract库错误解决方案_第1张图片

变量名:TESSDATA_PREFIX
变量值:E:\Tesseract-OCR\tessdata

3. 编辑文件 F:\python\Lib\site-packages\pytesseract\pytesseract.py 第26行

将 tesseract_cmd = 'tesseract'  改为:tesseract_cmd = 'E:\\Tesseract-OCR\\tesseract.exe'

tesseract_cmd = 'E:\\Tesseract-OCR\\tesseract.exe'

4.最后将其Tesseract-OCR加入到系统环境变量即可

验证码识别 | tesseract库错误解决方案_第2张图片

你可能感兴趣的:(玩转python,python,经验分享,运维)