pytesseract、PIL的使用与python实现简单的图像识别

1、背景

比如我们看到如下的一张图片:

I have a dream的节选

我们想提取这个图片中的问题,用于复制粘贴或者其它等用途,有没有办法直接识别?当然有啦,比如很多程序都支持这个功能:微信、有道笔记等。那python是否有包支持这个功能呢?今天就来学习和实践如何用python的pytesseract和PIL实现图片中的文本识别。

2、步骤

2.1、需要安装的包

pip install pytesseract

pip install PIL

2.2、程序的demo如下

图像文字识别

但执行的时候可能报错:

报错

通过查问题发现:python的pytesseract包会从系统的环境指令中查找tesseract指令;因此,需要在系统中安装这个程序;

mac安装方法:brew install tesseract,其它平台查询以下就好,很简单。

之后再执行以下就没问题啦:

Five score years ago, a great American, in whose symbolic

shadow we stand today, signed the Emancipation

Proclamation. This momentous decree came as a great

beacon light of hope to millions of Negro slaves who had been

seared in the flames of withering injustice. It came as a joyous

daybreak to end the long night of bad captivity.

你可能感兴趣的:(pytesseract、PIL的使用与python实现简单的图像识别)