深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别

深度学习基础篇【4】

从0开始搭建EasyOCR

并进行简单文字识别

所谓OCR,全称为“Optical Character Recognition”,即光学字符识别。简单来讲,它就是实现对文本资料的图像文件进行分析识别处理,以获取其中文字及版面信息的技术。 

- 语言环境:Python3.7

- 编译器:jupyter notebook

- 深度学习环境:pytorch 1.6

- 深度学习平台:极链AI云

- 显卡(GPU):NVIDIA RTX 2080Ti

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第1张图片

       目录

    01 实例创建

    02 准备工作

    03 数据预处理

    04 构建模型

    05 编译

    06 训练模型

    07 模型评估

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第2张图片

01 实例创建

1. 打开极链AI云平台

         https://cloud.videojj.com/?source=vx

2. 点击算力租赁

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第3张图片

 3. 选择合适的显卡

         此处我们以NVIDIA RTX 2080Ti为例

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第4张图片

4. 深度学习框架搭建

         框架选择pytorch,版本1.6

         python版本3.7

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第5张图片

5. 连接实例

创建完成后,点击jupyterlab连接

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第6张图片

6. 打开终端

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第7张图片

02 环境搭建

在终端中,输入以下命令使用 pip 安装 EasyOCR 稳定版本

pip install easyocr

更多内容请左右滑动

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第8张图片

进入GitHub地址

GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

下载目标文件

下载完成后,上传至root文件夹中,输入以下命令解压

pip install unzip # 安装unzipunzip EasyOCR-master

在命令提示符中使用cd命令进入目标文件夹地址,在使用 Python setup.py install 命令进行预安装​​​​​​​

cd EasyOCR-masterpython setup.py install

03 使用方法

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第9张图片

对该图片进行文字识别​​​​​​​

import easyocrreader = easyocr.Reader(['ch_sim','en']) # 只需要运行一次就可以将模型加载到内存中result = reader.readtext('chinese.jpg')

输出将采用列表格式,每个项目分别表示边界框,文本和置信度。

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第10张图片

注1:[‘ch_sim’,‘en’]是您要阅读的语言列表。 您可以一次传递几种语言,但并非所有语言都可以一起使用。 英语与每种语言都兼容。 共享公共字符的语言通常相互兼容。

注2:您也可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递,而不是filepath chinese.jpg。 原始图片的网址也是可以接受的。

注3:行reader = easyocr.Reader([‘ch_sim’,‘en’])用于将模型加载到内存中。 这需要一些时间,但只需要运行一次。

还可以将detail设置为0,以简化输出。

reader.readtext('chinese.jpg', detail = 0)

深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别_第11张图片

你可能感兴趣的:(pytorch,python,深度学习)