身份证识别训练器

一.tesseract-ocr简单使用与训练

一款由HP实验室开发由Google维护的开源OCROptical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document ImagingMODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

1、Tesseract实现

大体流程:Tesseract安装 -> 打开命令行 -> 生成目标文件

esseract安装

下载tesseract-ocr-setup-3.02.02.exe安装包,安装成功后会在相应磁盘下有Tesseract-OCR文件夹。

打开命令行

打开命令行,输入tesseract,回车

生成目标文件

2、Tesseract训练:

大体流程为:安装jTessBoxEditor -> 获取样本文件 -> Merge样本文件 –> 生成BOX文件 -> 定义字符配置文件 -> 字符矫正 -> 执行批处理文件 -> 将生成的traineddata放入tessdata中

 

二.图像二值化,自适应阈值化,全局阈值

图像处理中,会希望忽略掉一些灰度细节,只保留主体的轮廓,对灰度图像进行阈值化处理能达到这个目的。“其基本的思想是,给定一个数组和一个阈值,然后根据数组中的每个元素的值是低于还是高于阈值而进行一些处理,这里说的“数组即为图像数据.

 

1.自适应阈值是整幅图像使用一个阈值,自适应阈值是图像的不同区域使用不同的阈值,而这个阈值是对整个区域计算出来的。在Emgu中也是调用函数AdaptiveThreshold()来实现的。

public static AdaptiveThreshold(IInputArray src,IOutputArray dst,double maxValue,AdaptiveThresholdType adativeType,ThresholdType thresholdType,int blockSize,double param1)

AdaptiveThresholdType adativeType:自适应阈值计算方法:MeanC和GaussianC

ThresholdType thresholdType:必须为二值化阈值化或者是反二值化阈值化(Binary/BinaryInv)

int blockSize:计算使用的区域矩阵大小:3,5,7,9

2.全局阈值

全局阈值指的是整个图像数据使用一个阈值进行筛选分类,OpenCV提供cvThreshold()方法进行阈值化操作,在Emgu中对应的方法名称为Threshold

Threshold方法接受一个类型为ThresholdType的参数,ThresholdType是一个枚举类型,

二进制阈值化/反二进制阈值化处理后图像数据中只存在两种

可能的值:0max_value,这种图像称为二值化图像。

在数字图像处理中,二值图像占有非常重要的地位,首先,图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。其次,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像。所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。

全局阈值是整幅图像使用一个阀值,这并不能适应所有的情况。自适应阈值是图像的不同的区域使用不同的阀值,而阀值是对这个区域计算得来的,OpenCV提供cvAdaptiveThreshold()

函数进行自适应阈值化处理,这个函数提供两种计算阀值的方法,分别为CV_ADAPTIVE_THRESH_MEAN_CCV_ADAPTIVE_THRESH_GAUSSIAN_C

在这两种情况下,自适应阈值T(x,y)在每个像素点都不同。通过计算像素点周围的b x b区域的加权平均,然后减去一个常数来得到自适应阈值, b有参数block_size指定,常数有param指定。如果使CV_ADAPTIVE_THRESH_MEAN_C方法,那么对区域的所有像素平均加权。如果使用了CV_ADAPTIVE_THRESH_GAUSSIAN_C放,那么区域中的(x,y)周围的像素

根据高斯函数按照它们离中心点的距离进行加权计算。” EmguCVInvoke类提供了AdaptiveThreshold静态方法进行自适应阈值处理,

自适应阈值是整幅图像使用一个阈值,自适应阈值是图像的不同区域使用不同的阈值,而这个阈值是对整个区域计算出来的。在Emgu中也是调用函数AdaptiveThreshold()来实现的。

public static void AdaptiveThreshold(
	IInputArray src,
	IOutputArray dst,
	double maxValue,
	AdaptiveThresholdType adaptiveType,
	ThresholdType thresholdType,
	int blockSize,
	double param1
)

 

你可能感兴趣的:(身份证识别训练器)