paddleocr:使用自己的数据集训练文字检测模型

PaddleOCR地址:
https://github.com/PaddlePaddle/PaddleOCR
文字检测:
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/detection.md

一 数据准备

OCR数据标注工具:PPOCRLabel
cd 进入到PaddleOCR\PPOCRLabel,输入命令:
python PPOCRLabel.py --lang ch
ch为中文。en为英文。
输入上述命令python PPOCRLabel.py --lang ch,打开工具。
paddleocr:使用自己的数据集训练文字检测模型_第1张图片
使用方法:
打开文件后点击“自动标注”,标注完毕之后点击“OK”。
对不准确的标注结果进行手动更改矩形框。
对于未检出的文字,点击右上角的“矩形标注”进行人工标注。
点击右下角的“确认”按钮。
之后点击“文件”->“导出检测结果”。

Label.txt:
内容是图片路径名字、文字标签和矩形框的四个坐标,用于训练检测模型。
注意:所有的图片都放到了一个txt里面&#

你可能感兴趣的:(平时经验总结,paddlepaddle,深度学习,python)