百度飞桨PaddleOCR 使用记录(踩坑记录)

1.首先按照官方指南来操作

https://github.com/PaddlePaddle/PaddleOCR

2.训练自己的文本检测数据时要转换成其格式(json字符时注意要使用双引号,特殊字符要转换)

3.训练时发现内存会不断增加,最终会爆内存

a.首先把 configs/det/det_db_icdar15_reader.yml 配置里面的 num_workers设置为1。
b.将ppocr/data/reader_main.py的75行
return paddle.reader.multiprocess_reader(readers, False)
修改为
return function(0)
这样就可以正常训练了,感觉速度也没有变慢,好像还快了一点点。。。

win下面 python的 multiprocessing不好用,所以PaddleOCR在 win 下面会自动关闭多进程,所以上面用win 的兄弟可以正常训练,用 AIStudio 和 Linux 的就只能修改代码关闭多进程了。

参考:https://github.com/PaddlePaddle/PaddleOCR/issues/218

你可能感兴趣的:(深度学习)