ocr

0、为什么进行数据增强

真实业务场景中的数据量不足

提高文本行检测和识别的准确率

1、数据增强:

亮度处理:图片尽量贴合真实的场景(如手机拍出的照片有亮度的变化)

几何变换:旋转处理,随机裁剪,很快的扩充样本

模糊处理:减少图片中的噪声,降低细节层次(高斯模糊、均值模糊)

2、文本行检测--east

ocr_第1张图片

east速度、准确度都很高

传统由若干模块组成,文字区域检测、文字区域筛选、文本区域的合成,而east思想来自UNet

ocr_第2张图片

普通boundingbox是矩形,而文字一般比较长,且文字有旋转,普通的boundingbox不够精确,east算法是旋转矩形+四边形。

4、文本行识别

你可能感兴趣的:(CV)