windows下的图像识别(转载)

①安装PIL:pip install Pillow
②安装pytesser3:pip install pytesser3
③安装pytesseract:pip install pytesseract

④安装autopy3:
1.先安装wheel:pip install wheel
2.安装Tesseract-OCR:百度直接搜索Tesseract-OCR下载即可,比如:点击这里

这里要说明的是安装Tesseract-OCR后,其不会被默认添加至环境变量path中,会导致报错!!!

解决办法有两种:(先找到Tesseract-OCR安装文件夹,再找到tesseract.exe文件)
我这里的绝对路径是:D:\python\Tesseract-OCR\tesseract.exe
①将此路径添加至环境变量path中(不过我是这么做的,但是PyCharm仍旧报错)
②找到pytesseract.py文件
我这里是C:\Users\admin\AppData\Local\Programs\Python\Python36\Lib\site-packages\pytesseract\pytesseract.py

image.png

需要注意的是上图路径中的必须是这个‘/’而不是‘\’

进入正题,如何识别图像中文字

将下面的图片上的文字识别并打印出来:


aa.jpg

代码如下:

# _*_ coding:utf-8 _*_ 
 
import pytesseract 
from PIL import Image 
 
__author__ = 'admin' 
 
im = Image.open(r'C:\Users\Administrator\Desktop\aa.jpg') #这里必须是反斜杠
print(pytesseract.image_to_string(im))

结果如下图:

image.png

参照文章https://www.jb51.net/article/139829.htm

你可能感兴趣的:(windows下的图像识别(转载))