安装 python包opencv,Image,pytesseract
python版本需要3.x以上
为了加快速度,可以使用清华源
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple Image
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytesseract
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python
这个软件是由Google维护的开源的OCR软件。
下载地址:
https://pan.baidu.com/s/1w5qjfrl2mNdX0ajuNde2CA
提取码:28fc
下载后双击tesseract-ocr-setup-4.00.00dev.exe进行安装,记住安装路径。
win10修改环境变量
添加环境变量TESSDATA_PREFIX,变量值是你安装Tesseract-OCR的目录,比如D:\tesseract\Tesseract-OCR\tessdata
然后在path下添加%TESSDATA_PREFIX%\tesseract.exe
保存环境变量,一般情况下需要重启电脑。
找到python的安装路径下的pytesseract.py文件
找到你python安装包的目录,找到pytesseract.py文件,比如:
用编辑器打开,查找tesseract_cmd
将原来的 tesseract_cmd = ‘tesseract’ 改为: tesseract_cmd = ‘OCR的安装路径下的tessract.exe’
比如:
那么tesseract_cmd 的路径修改如下:
配置成功,开始试验:
import pytesseract
from PIL import Image
image = Image.open('test2.png')
code = pytesseract.image_to_string(image)
print("result:")
print(code)