【Python 基于EasyOCR库进行图片文字识别】

文章目录

  • 一、概况
      • 目前支持的语言
  • 二、安装指南(windows)
      • 1、通过pip安装
      • 2、通过源代码安装
  • 三、代码运用OCR
      • 要识别的图片
      • 1、代码_I
      • 识别结果_1
      • 2、代码_II
      • 识别结果_2
      • 3、代码_III
      • 识别结果_3
      • 4、代码_IV
      • 运行报错处理

一、概况

OCR是Optical Character Recognition的缩写,光学字符识别的意思。
EasyOCR是一个python模块,用于从图像中提取文本。它是一个通用的OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持80多种语言,并且还在扩展。

目前支持的语言

左边是支持的语言,右边是支持的语言对应的代码【Python 基于EasyOCR库进行图片文字识别】_第1张图片
【Python 基于EasyOCR库进行图片文字识别】_第2张图片
【Python 基于EasyOCR库进行图片文字识别】_第3张图片
【Python 基于EasyOCR库进行图片文字识别】_第4张图片
【Python 基于EasyOCR库进行图片文字识别】_第5张图片

二、安装指南(windows)

如果使用pytorch,可以再pytorch网站安装与查看说明使用。确保选择正确的CUDA版本。如果您打算只在CPU模式下运行,请选择CUDA = None。

1、通过pip安装

pip install easyocr

2、通过源代码安装

pip install git+git://github.com/jaidedai/easyocr.git

三、代码运用OCR

要识别的图片

【Python 基于EasyOCR库进行图片文字识别】_第6张图片

1、代码_I

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg')
#打印识别结果
print(result)

识别结果_1

输出的是列表格式,每一项分别代表文本框坐标[x,y]、文本和模型置信度的列表。
【Python 基于EasyOCR库进行图片文字识别】_第7张图片

2、代码_II

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0)
#打印识别结果
print(result)

识别结果_2

输出的是列表格式,每一项是识别到的文本。
8

3、代码_III

# 引入库
import easyocr
#设置要识别繁体中文和英文两种语言
reader = easyocr.Reader(['ch_tra', 'en']) #如果不用gpu可以设gpu=False
#设置要识别的图片
result = reader.readtext('chinese_tra.jpg', detail = 0, paragraph=True)
#打印识别结果
print(result)

识别结果_3

输出的是列表格式,内容直接是识别到的文本,不分项。
9

4、代码_IV

前三块代码识别图片输入的是本地图片路径

result = reader.readtext('chinese_tra.jpg')

字节格式的图像信息识别可以改写成如下代码:

with open("chinese_tra.jpg", "rb") as f:
    img = f.read()
result = reader.readtext(img)

URL网页图片信息识别可以改成如下代码

result = reader.readtext('图片的URL网址信息')

运行报错处理

如果运行程序的时候,程序自动下载模型出错,或者中断
10
可以点击这里进行手动下载模型,下载好的模型复制粘贴到路径:C:\Users\**********\.EasyOCR\model\ 下即可正常使用。

你可能感兴趣的:(Python,python,深度学习,pytorch)