Python---提取图片的文字信息

环境:

1.Python3
2.Python3的pillow、pytesseract包 
  可使用pip install pillow、pip install pytesseract命令安装。或者通过pycharm进行安装
3.识别引擎tesseract-ocr ,下载地址

代码:

#-*- coding:utf-8 -*-
from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'E://Tesseract-OCR/tesseract.exe'

# 使用pytesseract对英文进行识别,lang参数可省略
text = pytesseract.image_to_string(Image.open('E:\project\study_tornado\mm.jpg'), lang='eng')
# 使用pytesseract对中文进行识别,(含英文,但识别率降低)
text = pytesseract.image_to_string(Image.open('E:\project\study_tornado\mm.jpg'), lang='chi_sim')
print text

# 参考:https://blog.csdn.net/u010134642/article/details/78747630
# 参考:https://blog.csdn.net/helloc0de/article/details/80410250
# 参考:https://www.cnblogs.com/morwind/p/6867547.html

你可能感兴趣的:(Python基础)