python提取图片文字_python实现提取图片中文字

1

首先我贴出代码:

from PIL import Image

import pytesseract

text=pytesseract.image_to_string(Image.open('demo.png'),lang='chi_sim')

print(text)

python提取图片文字_python实现提取图片中文字_第1张图片

2

然后给出我的项目目录,以及图片信息,和最后的运行结果

python提取图片文字_python实现提取图片中文字_第2张图片

python提取图片文字_python实现提取图片中文字_第3张图片

5c9c964ce54a2f277a6cabb3e00192dd3240f4d8.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

3

但是就这样去运行肯定不会对的,需要去安装相应的模块:

首先安转pytesseract模块:在命令行中pip install pytesseract

python提取图片文字_python实现提取图片中文字_第4张图片

4

安装PIL模块,我直接使用pip install PIL出错了,是因为官方给出的PIL是32位的,但是我电脑是64位的,所以去下载Pillow-6.0.0-cp36-cp36m-win_amd64.whl这里cp36是我的python版本为3.6,请根据自己版本下载

python提取图片文字_python实现提取图片中文字_第5张图片

5

下载好之后,我们先安装wheel模块,然后安装刚才下载的文件

python提取图片文字_python实现提取图片中文字_第6张图片

6

在所需要的模块安装好之后,可能运行还是回出错,所以需要下载识别引擎tesseract-ocr

python提取图片文字_python实现提取图片中文字_第7张图片

7

下载好之后,我们就安装好它,然后设置pytesseract使用该识别引擎

python提取图片文字_python实现提取图片中文字_第8张图片

python提取图片文字_python实现提取图片中文字_第9张图片

8

最后就基本ok了,但是如果要要识别中文,就需要下载 tesseract-ocr的中文语言包了。总结而言,就是两个模块的安装,然后识别引擎的安装与配置,还有相应的语言包

END

你可能感兴趣的:(python提取图片文字)