PyCharm下调用pytesseract识别某网站验证码的的一些报错问题。

在这个过程中,我先来说我遇到的3个问题,其实也是相关联的,废话不多,现在开始,希望对看到文章的你有帮助!
一、pycharm运行代码,提示ModuleNotFoundError: No module named 'pytesseract'(找不到这个名叫‘pytesseract'的模块包)
解决方案:
方案1.首先检查自己有没有安装这个pytesseract这个模块包,快捷键windows+R,进入cmd命令窗口,输入pip install pytesseract如图:若安装会如下图,若没有安装,会给你安装pytesseract模块包。


1.jpg

方案2:通过pycharm命令行窗口Terminal,输入pip install pytesserac如图:若安装会如下图,若没有安装,会给你安装pytesseract模块包。


2.png

方案3:这个目前是自我认为最简单粗暴的方法,可以解决99.9%的类似问题。(!!!!!剩下的0.1%很有可能是你装了多个python的解释器,你明明安装了这个模块包,却还是提示你没有安装模块包,这个时候删除多余的python解释器就可以了)
1》点击File->settings for New project..
3.png

2》选择Project Interpreter,点击右边的+添加模块包 !
4.png

3》输入你想添加的包名,点击Install Package ,安装成功直接OK就可以啦。


5.png

二、通过上述方法安装了pytesseract和tesseract ,结果报这个错pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path(pytesseract.pytesseract.tesseractnotfounderror:未安装或不在您的路径中)这是因为我直接安装的是tesseract 这个模块包。没有装Tesseract-OCR这个库包。因为pycharm兼容的问题,我需要装一下库包,网上有部分说可以再pytesseract.py源码里面指向一下就行,但是指向也不起作用,只好乖乖安装esseract-OCR这个库包(具体看下面)
解决方案:
1、首先找到你的pytesseract.py源码,python我安装了anaconda3解释器(具体是什么,不过多赘述,需要用python时直接安装这个,不用单独下python,真的特别特别好用,推荐)在D:\Anaconda3\Lib\site-packages\pytesseract(你在哪儿安装的就在那儿找这个目录)如下:
6.png

然后打开pytesseract.py,将源码中的tesseract_cmd = 'tesseract'改为指定路径tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'(默认安装路径,若其他路径就选自己安装的),最后运行代码,如果还是提示pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path,这个时候就要下面的方案解决。
三、运行代码提示:pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
1、安装tesseract-ocr-setup-4.00.00dev.exe,一路下一步,安装完成以后,配置环境变量。
1》复制你的安装地址,我的是安装在C:\Program Files (x86)\Tesseract-OCR进入计算机-右键属性-系统高级设置-环境变量,找到path如图:点击编辑后面;C:\Program Files (x86)\Tesseract-OCR切记不要忘记前面的分号。
7.png

2》点击系统变量新建增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files (x86)\Tesseract-OCR\tessdata,全部确定,再次运行代码。
8.png

最后看看,是不是运行成功啦。快去试试吧!

你可能感兴趣的:(PyCharm下调用pytesseract识别某网站验证码的的一些报错问题。)