PaddleOCR识别模型训练及问题解决

1、下载PaddleOCR release2.3

2、整理数据集

标签文本中的路径和标签值中间是一个tab

读取标签文件的时候,是把标签文件中的路径和上面数据集的路径合在一起,然后指向图片。

3、训练模型和配置文件config相对应,

比如说用的模型是ch_PP-OCRv2_rec,那么对应的配置文件也是ch_PP-OCRv2_rec.yml

4、训练及测试的代码

python tools/train.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml


python tools/infer_rec.py -c configs/rec/ch_PP-OCRv2/ch_PP-OCRv2_rec.yml

评估及生成export模型,以及详细参数的测试

python tools/eval.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205121/best_accuracy"

python tools/export_model.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205121/best_accuracy"  Global.save_inference_dir="./output/rec/202205121/export_model"

python tools/infer_rec.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205160436/best_accuracy" Global.load_static_weights=false Global.infer_img="./train_data/test_20220429/"

5、测试的时候出现一个问题

PaddleOCR识别模型训练及问题解决_第1张图片

 准确率很高,但是每个图片的识别结果都比原来大111

反复试验了几次,觉得训练过程应该没有问题,应该是哪个细节没整对,导致出现了这个偏差,

然后就去看字典,下面是我的字典

PaddleOCR识别模型训练及问题解决_第2张图片

 

然后就看了一下icar15的字典

PaddleOCR识别模型训练及问题解决_第3张图片

 发现没有指向字符0,而是把字符1当成了字符0,把字符2当成了字符1,依次往下错了一位。

带BOM的UTF-8,        UTF-8

Windows(CRLF),        Unix(LF)

然后就搜了一下Windows(CRLF)和Unix(LF)的区别

PaddleOCR识别模型训练及问题解决_第4张图片

 根据以上线索,我重建了一个字典,然后用NotePad++把在Windows系统下建的txt文件格式改为Unix(LF)。编辑——》文档格式转换——》转为Unix(LF)

重新训练,结果正常

PaddleOCR识别模型训练及问题解决_第5张图片

 

你可能感兴趣的:(python,pytorch,paddle)