Opencv文档扫描OCR识别(python)

 案例 ©Fu Xianjun. All Rights Reserved.

一、读取图像

Opencv文档扫描OCR识别(python)_第1张图片

知识储备:常见的图像分割方法

1. 基于阈值的分割方法:全局阈值法、局部阈值法等 

2. 基于区域的分割方法:分水岭方法、区域生长法等

3. 基于边缘的分割方法:Canny边缘检测、轮廓检测等 

4. 基于特定理论的分割方法:聚类、模糊集等(机器学习)

5. 基于神经网络的分割方法:????

Opencv文档扫描OCR识别(python)_第2张图片

知识储备:区域生长算法的概念

         选取某个种子点(一般实际交互时就是鼠标点击的位置),从图像种子点位置开始,将种子点相邻的符合某个阈值范围内的像素添加到生长区域中,接着判断下一个像素点,直到没有可以符合条件的像素为止,此时分割完毕。

Opencv文档扫描OCR识别(python)_第3张图片

透视变换

Opencv文档扫描OCR识别(python)_第4张图片

Opencv文档扫描OCR识别(python)_第5张图片

4.OCR识别

a.安装tesseract(https://digi.bib.uni-mannheim.de/tesseract/) (https://digi.bib.uni-mannheim.de/tesseract/%EF%BC%89)

exe 与 pip installpytesseractb.配置系统变量:c.测试(powershell:tesseract scan.jpg result)d.OpenCV编程

Opencv文档扫描OCR识别(python)_第6张图片

Opencv文档扫描OCR识别(python)_第7张图片

方法二

Opencv文档扫描OCR识别(python)_第8张图片

对信用卡的数字进行选取,对于非卡号数字进行剔除

Opencv文档扫描OCR识别(python)_第9张图片

Opencv文档扫描OCR识别(python)_第10张图片

你可能感兴趣的:(opencv)