ocr识别中的图像分割方法小结

ocr识别中的图像分割方法小结

Email:[email protected]


      ocr 字符图像的特点是:背景复杂,存在如底纹、水印、底线、框线、加盖印章干扰叠加 ,同时存在 光照不匀、对比度小、倾斜、污迹、背景网络 、防伪标识、磨损、打印时着力不均、字的笔画深浅、及受油墨多寡的影等因素的影响,故图像的干扰和噪声大,采用普通的二值化分割方法效果不佳,故针对 OCR图像需采用特定的算法进行二值化。


     OCR图像二值化流程如下:

1.  图像光照均匀性分析,获取图像光照分布map;

2.  图像边缘分析、得到图像的边缘分布模型,得到总体的边缘度量权值w1;

3.  图像模糊度计算,得到图像模糊权值w2.

4.  对图像进行局部分块处理,利用图像对应分块的map特征、w1、w2的权值,得到图像每个分块的局部二值结果。

5.  对整幅图像局部二值化结果进行空白填充处理防止字符断裂,对分割的游离点进行分析剔除异常噪点

6.  直线剔除。

OCR字符分割结果如下
  

 

                                      ocr分割结果

 

 

你可能感兴趣的:(数字图像处理,模式识别,计算机视觉)