PIL全称:Python Imaging Library,python图像处理库,这个库支持多种文件格式,并提供了强大的图像处理和图形处理能力。由于PIL仅支持到Python 2.7,所以在PIL的基础上创建了Pillow库,支持最新Python 3.x。
pip install pillow
pip install pytesseract
如果你使用的是Pycharm工具的话,你可以找到File->Settings->Project Interpreter下,点击“+”号,在搜索的页面中输入以上两个库,进行安装。
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'F:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
----------------------------------------------------------华丽的分割线------------------------------------------------------------
# -*- cording:utf-8 -*-
from PIL import Image
import pytesseract
img = Image.open("eeee.png")
text = pytesseract.image_to_string(img, lang='eng') #如果图片是中文,将lang='chi_sim'(此为tesseract-ocr中语言包下的各语言名称)
print(text)