PaddlePaddle飞桨OCR文本检测——识别模型训练(三)

上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152
飞桨的OCR模型分为检测、识别和分类,今天讨论识别。
ORC的识别,就是给定一张剪辑好的图片,这个图片只有一串纯文本,计算机将图片里的内容识别出来。
要识别的图片:
PaddlePaddle飞桨OCR文本检测——识别模型训练(三)_第1张图片
OCR的识别和目标识别差不多,都是把猫的图片识别成猫,狗的图片识别成狗
PaddlePaddle飞桨OCR文本检测——识别模型训练(三)_第2张图片

数据集准备

进入正题
自定义图片标注的方法上一篇讲过,产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rec_gt.txt,这两个就是识别的数据集和标签。

这回用一下别人现成的数据集:icdar2015
可以在官网上注册下载,也可以在我的网盘下载:
链接:https://pan.baidu.com/s/1_w3QqHRciZ4ljYGxauzf4Q
提取码:47xv

注意这个数据集的标签格式与飞桨的读取格式不兼容,需要转换,参考
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md
云盘分享的已经包含转换后的标签。

数据集安置

在PaddleOCR-dygraph根目录下建立一个文件夹"train_data",再新建一个文件夹"ic2015_data"作为数据集存放的位置,在ic2015_data里放入训练集和测试集的标签和对应的两个文件夹的图片(只放图片)。
PaddlePaddle飞桨OCR文本检测——识别模型训练(三)_第3张图片

预训练模型安置

可以从网上下载预训练模型,比如https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mv3_none_bilstm_ctc_v2.0_train.tar

将解压后的模型文件夹放在PaddleOCR-dygraph下新建的pretrain_models文件夹中,操作同上篇文章。

调参

在这里插入图片描述
找到rec_icdar15_train.yml,这是识别模型的参数训练设置,记事本打开。
里面的参数看着改,主要是图片文件夹和标签文件路径:
data_dir: ./train_data/ic2015_data
label_file_list: ["./train_data/ic2015_data/rec_gt_train.txt"]
如果有预训练模型,还要改pretrained_model路径
注意测试集和训练集的路径都要调整。

训练开始

在PaddleOCR-dygraph根目录打开cmd,输入以下命令即可测试

python -m paddle.distributed.launch tools/train.py -c configs/rec/rec_icdar15_train.yml

训练进行中:
PaddlePaddle飞桨OCR文本检测——识别模型训练(三)_第4张图片

一切都可以从手册学到https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

你可能感兴趣的:(人工智障,Python,深度学习,机器学习,python,计算机视觉)