PaddleOCR整体了解

PaddleOCR介绍

PaddleOCR是一个文字识别模型套件,通过整合3阶段模型:文本框检测 - 角度分类 - 文字识别,实现识别图片文字。

默认提供了两个PaddleHub Module:

(1)chinese_ocr_db_crnn_server:通用OCR模型

(2)chinese_ocr_db_crnn_mobile:轻量OCR模型

我们可以直接利用上述的PaddleHub Module进行预测(参考:chinese_ocr_db_crnn_server),也可以通过PaddleOCR源码提供的工具进行预测。

PaddleOCR功能

(1)可以单独针对文本检测、文本方向分类、文字识别3个不同的模型进行预测,也可以串联起来

(2)提供每个阶段的推理模型(多用于预测部署)、训练模型(多用于恢复训练),支持从训练模型转推理模型

(3)除了提供默认的DB文本检测模型、CRNN文字识别,还提供其它算法的模型,例如EAST、SAST文本检测算法模型

(4)用户可以基于训练模型,结合自己的数据集/其它官方数据集,训练出自己的模型并转为推理模型

(5)用户可以基于推理模型转换为部署所需要的服务模块/PaddleHub Module

你可能感兴趣的:(PaddlePaddle,PaddlePaddle,PaddleOCR,文字识别)