python识别图片数字、汉字、英文

一、安装包tesseract

安装包连接如下

Index of /tesseract (uni-mannheim.de)

python识别图片数字、汉字、英文_第1张图片

 

安装方法,直接运行安装到要的目录下,然后进行环境变量配置

1.全局变量中path变量配置,路径就是安装地址;

python识别图片数字、汉字、英文_第2张图片

 2.TESSDATA_PREFIX配置,路径一定要选对了,tessdata;安装完成后最好界面都关掉,这样才能保证生效;

python识别图片数字、汉字、英文_第3张图片

二、python包的安装

在虚拟环境目录下指定进行安装

pip install -i Simple Index --target=D:\pythonProject1\venv\Lib\site-packages pillow

pip install -i Simple Index --target=D:\pythonProject1\venv\Lib\site-packages pytesseract

pytesseract安装完成后要进行 tesseract位置的指定,在安装的虚拟环境目录下找到pytesseract的py文件,见下图,将原来的内容替换成安装的目录下指定到.exe;

python识别图片数字、汉字、英文_第4张图片

 

三、图像识别

from PIL import Image
import pytesseract
path=r'D:\Photo\test\9794.jpg'
im = Image.open(path)
text = pytesseract.image_to_string(im,config="--psm 6")
print(text)
print('输入输出')

识别图片内容如下:

python识别图片数字、汉字、英文_第5张图片

 

 

你可能感兴趣的:(python)