安装了Tesseract模块后识别验证码,却报以下错误:
FileNotFoundError: [WinError 2] 系统找不到指定的文件。
pytesseract.pytesseract.TesseractError:
(2, 'Usage: python pytesseract.py [-l lang] input_file')
pytesseract.pytesseract.TesseractError:
(1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata')
原因是该模块依赖于Tesseract-OCR,需要进行手动安装,下载地址如下:
https://digi.bib.uni-mannheim.de/tesseract/
1、下载Tesseract-OCR
2、需要其加入到环境变量中:
变量名:TESSDATA_PREFIX
变量值:E:\Tesseract-OCR\tessdata
3. 编辑文件 F:\python\Lib\site-packages\pytesseract\pytesseract.py 第26行
将 tesseract_cmd = 'tesseract' 改为:tesseract_cmd = 'E:\\Tesseract-OCR\\tesseract.exe'
tesseract_cmd = 'E:\\Tesseract-OCR\\tesseract.exe'
4.最后将其Tesseract-OCR加入到系统环境变量即可