paddleocr:使用自己的数据集微调文字识别模型

PaddleOCR地址:https://github.com/PaddlePaddle/PaddleOCR

注意:

1 OCR半自动数据标注工具:PPOCRLabel
使用python3和pyqt5编写,支持矩形框标注和四点标注模式,导出格式可直接用于PPOCR检测和识别模型的训练。
用于构建训练、验证、测试的数据集。
PPOCRLabel说明和数据集划分方法见如下地址:
https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.4/PPOCRLabel/README_ch.md

2 configs 用于配置预训练模型的参数

一 数据准备

1 OCR数据标注工具:PPOCRLabel
cd 进入到PaddleOCR\PPOCRLabel,输入命令:
python PPOCRLabel.py --lang ch
ch为中文。en为英文。
输入上述命令python PPOCRLabel.py --lang ch,打开工具。如下图:
paddleocr:使用自己的数据集微调文字识别模型_第1张图片

打开文件后点击“自动标注”,标注完毕之后点击“OK”。
对不准确的标注结果进行手动更改矩形框。

你可能感兴趣的:(平时经验总结,paddlepaddle,深度学习,python)