ThetaQing

Halcon学习笔记（九）——OCR实战练习倾斜日期检测、倒着的字符检测

第四-八讲 OCR实战练习

在基于之前的例程分析之上，这里做具体应用，比如，食品包装袋上倾斜的日期识别，温度计上倒着的字符识别等。

倾斜日期识别

首先，对于这样一幅图片，怎样实现对日期的提取？

法一：矫正—分割—识别

第一步：矫正
在上一篇博客（OCR识别字符排列圆形或字体倾斜的处理办法）中我们分析了如何矫正倾斜的字符，这里直接上代码。这里推荐了两种方法实现，最终实现的识别效果都是一样的。
第一种方法，直接将其看做倾斜字符，利用单位矩阵和倾斜角度，保持y轴固定不动进行仿射得到的图像如下，这种方法得到的图形y轴是竖直的，但x轴不是水平的，如果想要x轴水平，将hom_mat2d_slant的参数``x改为’y’`即可。

* 加载图片，注意更改文件名
	read_image (Image, 'ImageName')
	text_line_slant (Image, Image, 60, rad(-45), rad(45), SlantAngle)
    hom_mat2d_identity (HomMat2DIdentity)
    hom_mat2d_slant (HomMat2DIdentity, -SlantAngle, 'x', 0, 0, HomMat2DSlant)
    affine_trans_image (Image, ImageAffineTrans, HomMat2DSlant, 'constant', 'false')

第二种方法，利用区域定位gen_rectangle1和强制转换vector_angle_to_rigid在几何定位+仿射+车牌识别中有说明，和第一种方法不同的是，这里采用的是旋转变换，固定位置不变的点是(Height/2, Width/2)，这样得到的仿射变换后的图形x, y都是水平或竖直的。代码如下。

	get_image_size (Image, Width, Height)
    gen_rectangle1 (ROI_0, 258.724, 388.308, 645.626, 1209.03)
    text_line_orientation (ROI_0, Image, 75, -0.4, 0.4, OrientationAngle)
    vector_angle_to_rigid (Height/2, Width/2, OrientationAngle, Height/2, Width/2, 0, HomMat2D)
    affine_trans_image (Image, ImageAffineTrans1, HomMat2D, 'constant', 'false')

第二步：分割
同样分析两种方法，第一种方法是常规操作，由于背景简单，我们直接借助直方图工具做阈值化，然后通过选择区域、腐蚀、膨胀、打散、求交集等一系列操作，由于这一部分在之前的笔记中都多次提到，且对于每个图片的操作都要“因图制宜”，基本思路一样，即把感兴趣的区域想方设法拎出来，并且单个字符属于一个连通域，参数或者步骤不尽相同，这里给出参考程序。

	threshold (ImageAffineTrans, Regions, 0, 215)
    connection (Regions, ConnectedRegions)
    select_shape (ConnectedRegions, SelectedRegions, 'area', 'and', 0, 35498.5)
    erosion_circle (SelectedRegions, RegionErosion, 3.5)
    dilation_circle (RegionErosion, RegionDilation, 9)
    union1 (RegionDilation, RegionUnion)
    connection (RegionUnion, ConnectedRegions1)
    intersection (ConnectedRegions1, ConnectedRegions, RegionIntersection)
  
    select_shape (RegionIntersection, SelectedRegions1, 'area', 'and', 333.08, 5000)
    partition_dynamic (SelectedRegions1, Partitioned, 50, 20)

    sort_region (Partitioned, SortedRegions, 'character', 'true', 'row')

第二种方法是考虑到数字是点状的，因此我们调用dots_image算子直接实现对点状图形的提取。
dots_image (ImageAffineTrans, DotImage, 15, 'dark', 0)
得到

然后对得到的DotImage进行快速阈值化，（因为灰度分布区别显著），然后膨胀，使得单个字符之间全部连接，再打散，注意是先连接后打散，然后做形状转换，主要是为了更好的利用面积选择区域，除去噪声点，最后分割单个字符并求交集。

	binary_threshold (DotImage, Region, 'max_separability', 'light', UsedThreshold)

    dilation_rectangle1 (Region, RegionDilation2, 10, 10)
    connection (RegionDilation2, ConnectedRegions2)
    shape_trans (ConnectedRegions2, RegionTrans, 'rectangle1')
    
    select_shape (RegionTrans, SelectedRegions2, 'area', 'and', 2260.48, 15673.7)
    partition_dynamic (SelectedRegions2, Partitioned1, 50, 20)
    intersection (Partitioned1, Region, RegionIntersection1)

得到和第一种方法相同的结果

第三步：识别
即读取OCR分类器，做识别测试，这里需要注意的是，图片中的字体是点状的打印字体，所以应该加载DotPrint_0-9A-Z_NoRej.omc字体。

	read_ocr_class_mlp ('DotPrint_0-9A-Z_NoRej.omc', OCRHandle)
    do_ocr_multi_class_mlp (SortedRegions, ImageAffineTrans, OCRHandle, Class, Confidence)

识别结果可以在控制变量窗口看到：

法二：借助OCR助手

借助OCR助手实现字符识别，我们在几何定位+仿射+车牌识别中实现了对车牌号的识别，下面进一步分析OCR助手的应用。
打开助手，选择打开新的OCR，配置设置页面，使用一个矩形框在图像中标记出需要识别文本的位置绘制文本位置（右击鼠标确定），选择字符特点，并输入希望读取的文本，选择图像窗口，最后应用快速设置，得到识别结果

那么实现的原理是什么呢？

转到分割页面

我们可以看到实际上就是根据识别符号的这些特征在预训练分类器（自动识别，可在字体页面查看）中进行测试得到的结果。
下面我们来查看利用OCR助手生成的代码是什么样子的

第一步：创建文本模板并设置模板参数
我们在OCR识别初步利用文本模板识别与生成训练文件的第一个示例中分析了，这里大同小异，实际上就是设置刚刚我们在分割页面看到的那些参数。

    create_text_model_reader ('manual', [], TextModel)
    set_text_model_param (TextModel, 'manual_is_dotprint', 'true')
    set_text_model_param (TextModel, 'manual_char_width', 47)
    set_text_model_param (TextModel, 'manual_char_height', 100)
    set_text_model_param (TextModel, 'manual_stroke_width', 9.9)
    set_text_model_param (TextModel, 'manual_return_punctuation', 'false')
    set_text_model_param (TextModel, 'manual_uppercase_only', 'true')
    set_text_model_param (TextModel, 'manual_fragment_size_min', 24)
    set_text_model_param (TextModel, 'manual_eliminate_border_blobs', 'true')
    set_text_model_param (TextModel, 'manual_base_line_tolerance', 0.2)
    set_text_model_param (TextModel, 'manual_max_line_num', 2)

第二步：加载分类器

     read_ocr_class_mlp ('DotPrint_NoRej.omc', OcrHandle)

第三步：切割文本部分
通过我们刚刚绘制的矩形和图像做差得到我们文本所在的区域

      copy_obj (Image, Image, 1, 1)
      gen_rectangle2 (ROI_OCR_01_0, 417.862, 717.78, rad(6.76665), 349.965, 157.831)
      access_channel (Image, TmpObj_Mono, 1)
	  reduce_domain (TmpObj_Mono, ROI_OCR_01_0, TmpObj_MonoReduced_OCR_01_0)

第四步：旋转矫正
定义偏移的角度，利用单位矩阵做旋转仿射变换。

	TmpCtrl_Orientation := 0.1181
	hom_mat2d_identity (TmpCtrl_MatrixIdentity)
    hom_mat2d_rotate (TmpCtrl_MatrixIdentity, -TmpCtrl_Orientation, 0, 0, TmpCtrl_MatrixRotation)
    affine_trans_image (TmpObj_MonoReduced_OCR_01_0, ImageOCR, TmpCtrl_MatrixRotation, 'constant', 'false')

第五步：读取文本信息并识别

	find_text (ImageOCR, TextModel, TextResultID)
	get_text_object (Characters, TextResultID, 'all_lines')
	dev_display (ImageOCR)
    dev_set_draw ('fill')
    dev_set_colored (3)
    dev_display (Characters)
    do_ocr_multi_class_mlp (Characters, ImageOCR, OcrHandle, Class1, Confidence1)

最后得到识别结果为

但是事实上，OCR助手给出的第四步和第五步完整程序如下：

   TmpCtrl_Orientation := 0.1181
    * OCR 01: Build rotation matrix
    hom_mat2d_identity (TmpCtrl_MatrixIdentity)
    hom_mat2d_rotate (TmpCtrl_MatrixIdentity, -TmpCtrl_Orientation, 0, 0, TmpCtrl_MatrixRotation)
    * OCR 01: Apply transformation to image and domain
    get_domain (TmpObj_MonoReduced_OCR_01_0, TmpObj_Domain)
    get_system ('clip_region', TmpCtrl_ClipRegion)
    set_system ('clip_region', 'false')
    dilation_circle (TmpObj_Domain, TmpObj_DomainExpanded, 49)
    affine_trans_region (TmpObj_DomainExpanded, TmpObj_DomainTransformedRaw, TmpCtrl_MatrixRotation, 'true')
    smallest_rectangle1 (TmpObj_DomainTransformedRaw, TmpCtrl_Row1, TmpCtrl_Col1, TmpCtrl_Row2, TmpCtrl_Col2)
    hom_mat2d_translate (TmpCtrl_MatrixIdentity, -TmpCtrl_Row1, -TmpCtrl_Col1, TmpCtrl_MatrixTranslation)
    hom_mat2d_compose (TmpCtrl_MatrixTranslation, TmpCtrl_MatrixRotation, TmpCtrl_MatrixComposite)
    affine_trans_region (TmpObj_Domain, TmpObj_DomainTransformed, TmpCtrl_MatrixComposite, 'true')
    affine_trans_image (TmpObj_MonoReduced_OCR_01_0, TmpObj_ImageTransformed, TmpCtrl_MatrixComposite, 'constant', 'true')
    dilation_circle (TmpObj_Domain, TmpObj_DomainExpanded, 49)
    expand_domain_gray (TmpObj_ImageTransformed, TmpObj_ImageTransformedExpanded, 49)
    reduce_domain (TmpObj_ImageTransformed, TmpObj_DomainTransformed, TmpObj_ImageTransformedReduced)
    crop_part (TmpObj_ImageTransformedReduced, TmpObj_MonoReduced_OCR_01_0, 0, 0, TmpCtrl_Col2-TmpCtrl_Col1+1, TmpCtrl_Row2-TmpCtrl_Row1+1)
    set_system ('clip_region', TmpCtrl_ClipRegion)
    find_text (TmpObj_MonoReduced_OCR_01_0, TextModel, TmpCtrl_ResultHandle_OCR_01_0)
    * OCR 01: 
    * OCR 01: Read text (classification step)
    get_text_object (Symbols_OCR_01_0, TmpCtrl_ResultHandle_OCR_01_0, 'manual_all_lines')
    dev_display (TmpObj_MonoReduced_OCR_01_0)
    dev_set_draw ('fill')
    dev_set_colored (3)
    dev_display (Symbols_OCR_01_0)
    do_ocr_multi_class_mlp (Symbols_OCR_01_0, TmpObj_MonoReduced_OCR_01_0, OcrHandle, SymbolNames_OCR_01_0, Confidences_OCR_01_0)
    * OCR 01: 
    * OCR 01: Do something with the results

这里它主要区别在第四步，通过不断地变换，把其他区域剪裁掉只剩下文本区域，太费周折，最后显示为

有点兜圈子的感觉，博主觉得脑袋不够转，所以没有仔细研究它的每步变换。

最后补充一点，我们还可以借助OCR助手进行训练并形成omc文件，具体方法是在刚刚OCR助手的字体
页面，将预训练分类器改为训练文件，然后写入需要训练的数据，点击加入训练数据，下面按步骤梳理一遍。
1、配置设置页面并应用
2、配置字体页面，选择训练文件，在空白框处添加训练数据

3、添加训练的特征
4、开始训练，形成omc文件
5、下次使用时直接加载刚刚训练的OMC文件就好了

倒着的字符检测

刚刚完成了倾斜字符检测，那么倒着的怎么办？如下

我们的思路还是一样的，首先是矫正，其次是把字符抠出来，最后是识别。
第一步：矫正
这里的矫正很简单，字符是倒挂着的，所以我们就用镜像可以搞定。连续两次镜像便完成了。

mirror_image (Image, ImageMirror, 'row')
mirror_image (ImageMirror, ImageMirror1, 'column')

参数是row表示基于行镜像，即上下镜像，反之左右镜像。
第二步：分割字符
有两个思路，第一个思路是手动把那个矩形区域画出来，然后reduce_domain把区域抠出来，第二个思路就是我们常用的基于Blob分析，也是博主采用的方式。
我们发现这里直接用灰度直方图工具分割很难将矩形区域或者字符分割出来，因为它们之间的灰度相差很近，所以我们想到如果能够提高它们的灰度对比度，在用灰度直方图就很轻松了。这里介绍一个能实现我们想法的工具——缩放。
在镜像后的图像页面，然后还是打开灰度直方图工具，然而不是点击阈值,而是下拉菜单的缩放。

滑动光标，你会发现图像的对比度随着光标的移动而移动，找到你认为合理的位置，即矩形区域与它周围的区域相差很大，外围没关系，等一下选择区域就可以搞定，主要是周围的区域。这是博主选的范围

然后类似的，插入代码即可，（生成的代码调用了scale_image进行图像缩放）接下来就是中规中矩的阈值化threshold，然后想方设法地把26单独抠出来，并且单个字符形成单独的连通域。
首先我们要把字符选择出来，所以阈值化之后打散成单个连通域，通过面积选择先把矩形区域选择出来，通过做差得到矩形区域。

scale_image (ImageMirror1, ImageScaled, 9.10714, -1739)
threshold (ImageScaled, Regions, 0, 142)
connection (Regions, ConnectedRegions)
select_shape (ConnectedRegions, SelectedRegions, 'area', 'and', 169940, 2.38293e+006)
reduce_domain (ImageMirror1, SelectedRegions, ImageReduced)

最后得到的矩形区域，在一系列操作和你手动画个矩形然后抠图的效果是一样的~~

得到这个区域之后，自然第一步是阈值化，考虑到要把两个字符单独形成连通域，所以我们在打散做形状选择之前先膨胀一下dilation_rectangle1，把字符中间断开的部分连起来，这样打散的时候字符就是一个连通域啦~

此时字符之间就完全连起来啦~
接下来就是打散，然后借助特征直方图根据面积和高度特征把字符选出来啦，这里的特征根据需求自定，一般常用的有area，height, width等，这部分我们在实现相机物体抓取已经展示过了，就不加赘述。然后把选择出来的字符和原来没有膨胀的区域做交集，得到我们需要识别的字符。这一步主要是保证我们识别的字符是原始图像中字符的形状大小。

threshold (ImageReduced, Regions1, 0, 138)
dilation_rectangle1 (Regions1, RegionDilation, 11, 11)
connection (RegionDilation, ConnectedRegions1)
select_shape (ConnectedRegions1, SelectedRegions1, ['height','area'], 'and', [191.99,15306.9], [245.13,21744])
erosion_rectangle1 (SelectedRegions1, RegionErosion, 11, 11)
intersection (RegionErosion, Regions1, RegionIntersection)

第三步：识别
读取分类器，注意选择的是OMC文件是Industrial_0-9_Rej.omc，然后识别，就OK了~

read_ocr_class_mlp ('Industrial_0-9_Rej.omc', OCRHandle)
do_ocr_multi_class_mlp (RegionIntersection, ImageReduced, OCRHandle, Class, Confidence)

识别结果

第四步：显示
先得到字符的位置
smallest_rectangle1 (RegionIntersection, Row1, Column1, Row2, Column2)
然后遍历显示就好了，注意在这之前要先打开一个窗口

count_obj (RegionIntersection, Number)
dev_display (ImageMirror1)
for Index := 1 to Number by 1
    disp_message (WindowHandle, Class[Index-1], 'image', Row2[Index - 1], Column1[Index - 1], 'red', 'false')
endfor

贴一下完整的代码~

dev_close_window ()

read_image (Image, 'F:/字符.bmp')
get_image_size (Image, Width, Height)
dev_open_window (0, 0, Width/4, Height/4, 'black', WindowHandle)
set_display_font (WindowHandle, 60, 'mono', 'true', 'false')
dev_display (Image)
mirror_image (Image, ImageMirror, 'row')
mirror_image (ImageMirror, ImageMirror1, 'column')
scale_image (ImageMirror1, ImageScaled, 9.10714, -1739)
threshold (ImageScaled, Regions, 0, 142)
connection (Regions, ConnectedRegions)
select_shape (ConnectedRegions, SelectedRegions, 'area', 'and', 169940, 2.38293e+006)
reduce_domain (ImageMirror1, SelectedRegions, ImageReduced)
threshold (ImageReduced, Regions1, 0, 138)
dilation_rectangle1 (Regions1, RegionDilation, 11, 11)
connection (RegionDilation, ConnectedRegions1)
select_shape (ConnectedRegions1, SelectedRegions1, ['height','area'], 'and', [191.99,15306.9], [245.13,21744])
erosion_rectangle1 (SelectedRegions1, RegionErosion, 11, 11)
intersection (RegionErosion, Regions1, RegionIntersection)

read_ocr_class_mlp ('Industrial_0-9_Rej.omc', OCRHandle)
do_ocr_multi_class_mlp (RegionIntersection, ImageReduced, OCRHandle, Class, Confidence)

smallest_rectangle1 (RegionIntersection, Row1, Column1, Row2, Column2)
count_obj (RegionIntersection, Number)
dev_display (ImageMirror1)
for Index := 1 to Number by 1
    disp_message (WindowHandle, Class[Index-1], 'image', Row2[Index - 1], Column1[Index - 1], 'red', 'false')
endfor

至此，这个项目就算是告一段落了，下一篇博客进行~

Halcon学习笔记——Region特征类算子(1) 一楼二栋算法机器学习
Region特征类算子region_features(Regions::Features:Value)*计算区域的形状特征*输入参数：*Regions————待检测区域*Features————要检测的特征（默认值：'area',可选值见Region特征图所示）*输出参数：*Value————计算的特征*Features可以输入单个或者多个特征，例如['area','anisometry']sel
Halcon学习笔记——Tuple类算子一楼二栋学习
数组运算y:=[1,2,10,5,0,10]x:=[10,10,20,0,5,-10]a:=[10.5,-10.5,0,3]b:=[3.1415,0,1.5708,0.785]c:=[2,1,-2,3,5,-10]d:=[3,-10.5,0,5]tuple_abs(a,Abs)*计算一个元组的绝对值*元组中的元素为整型，则返回绝对值也为整型，为浮点型，则返回浮点型，可以混合*[10.5,10.5,
Halcon学习笔记——Region类算子(1) 一楼二栋学习
connection(Region:ConnectedRegions::)*将不相连的区域都分割成单独的区域*Region：输入，ConnectedRegions：输出union1(Region:RegionUnion::)*将各自独立的区域合并成一整块区域(返回所有输入区域的并集)*Region：输入，RegionUnion：输出*与connection()相反union2(Region1,Re
halcon学习笔记（一）毛边检测仿射变换+标准区域登陆检测内外边缘毛边 weixin_44482092 halcon 算法人工智能计算机视觉
一、中级视频教程毛刺检测：实现功能，检测突出产品外围突出的毛刺：1.先获取背景的区域，用binary_threshold()获取背景区域A；2.背景区域进行闭运算得到闭运算区域B3.用difference（）算子计算AB两个区域的补集C；4.对C进行开运算，使边缘平滑。记得到边缘突出的毛刺使用到的算子：binary_threshold（）自动全局阈值，得到背景获背景和前景，适合使用在背景和前景差异
HALCON学习笔记（八）——HALCON相关实例和算法 weixin_45482443 HALCON
字符分割和识别字符识别(OCR）是在图像中识别字符的过程。主要包括在图像中的单个字符分割出来，将分割出来的字符进行分类两个部分。实例：dev_update_window('off')read_image(Image,'printer_chip/printer_chip_01')get_image_size(Image,Width,Height)dev_close_window()dev_open_
Halcon学习笔记诗仙&李白机器视觉学习笔记
目录一.简介一.简介Halcon和OpenCV在工业应用中的区别：OpenCV的精度没Halcon高；OpenCV没有模板匹配，Halcon有，而且Halcon匹配的精度更高。
halcon学习笔记-01.Halcon简介 zxmyoung Halcon 图像处理机器学习
1.概述HALCON是德国MVtec公司开发的一套完善的标准的机器视觉算法包，拥有应用广泛的机器视觉集成开发环境，用户可以利用其开放式结构快速开发图像处理和机器视觉软件。其集成开发环境HDevelop可在Windows、Linux、UNLX系统下使用。使用HDevelop进行编程的过程一般是，在HDevelop环境中编写算法部分，使用C++、C#、VB等开发应用程序，从HDevelop中导出算法代
HalCon学习笔记6 工大陈机器视觉 halcon 学习算法
halcon的数据结构之region、xld机器视觉的任务之一就是识别图像中的包含某种特性的区域，比如执行一个阈值分割处理，因此至少我们还需要一种数据结构，它可以表示一副图像中一个任意的像素子集，我们把区域定义为离散平面的任意子集使用halcon算子threshold来看看得到区域的效果，其中红色部分就是灰度值在123到255的所有像素点的集合，他们将作为一个整体作为一个区域，使用变量Region
halcon学习笔记 Alphapeople 学习笔记
读取图片：read_image(Image,'C:/test.png')Halcon的一些基本数据结构：（1）Image：指Halcon的图像类型，由矩阵数据组成，矩阵中的每个值表示一个像素。Image中含有单通道或者多通道的颜色信息。（2）Region：指图像中的一块区域。该区域数据由点的坐标组成，表达的意义类似于一个范围。可以用Region来创建一个感兴趣区域（RegionofInterest
Halcon学习笔记_03：Blob分析 PaQiuQiu Halcon玩转机器视觉 Blob分析
Blob分析由以下步骤组成：采集图像->提取ROI->图像或ROI对齐->修正图像->图像预处理->提取分割参数->分割图像->区域预处理->提取特征->将结果转为世界坐标->可视化显示1.修正图像图像或区域对齐问题：（SolutionGuideIII-Cinsection3.4）2.图像预处理消除噪声的相关函数：mean_image（）gauss_image（）相对高斯滤波速度快，效果不完美的函
HALCON学习笔记之blob分析+特征（定位） 11 学习ing的青年计算机视觉
blob分析+特征（定位）*采集图像dev_close_window()dev_update_off()read_image(ImageOrig,'blister/blister_reference')dev_open_window_fit_image(ImageOrig,0,0,-1,-1,WindowHandle)set_display_font(WindowHandle,14,'mono',
HalCon学习笔记3 工大陈机器视觉 halcon 学习计算机视觉图像处理
一、实例透视形变图像校正透视形变图形校正步骤如下1.读取图像，并对图像进行简单的处理，分割出目标形变区域2.获取形变区域的轮廓，并计算出顶点坐标信息3.利用上一步得出的坐标信息，计算投影变换矩阵4.进行投影变换二、实现代码1.将图像转化为灰度图像rgb1_to_gray(Image_display,GrayImage)rgb1_to_gray将RGB图像转换为灰度图像RGB图像的三个通道作为输入图
Halcon学习笔记——条形码的定位与识别 weixin_30708329 数据结构与算法 c#
一维码的原理与结构条码基本原理是利用条纹和间隔或宽窄条纹（间隔）构成二进制的”0“和”1“，反映的是某种信息。一维条码数据结构，分四个区域。组成分别为静区、起始/终止符、校验符、数据符。一维条码的意识形态结构，分三条。构成一维码的基本单元是模块，模块是指条码中最窄的条或空；构成条码的条或空称为一个单元，一个单元包含多个或单个模块；一个单元包含的模块数量由编码方式决定，即形成了不同的码制。一维码的定
Halcon学习笔记：xyz_attrib_to_object_model_3d示例 Leon_Chan0 HALCON
Halcon学习笔记：xyz_attrib_to_object_model_3d——从X、Y和Z图像中创建3D对象模型同时附加属性xyz_attrib_to_object_model_3d.hdevThisexampleprogramshowstheusageoftheprocedurexyz_attrib_to_object_model_3d.Itcanbeusedtocreate3Dobjec
Halcon相机标定及利用标定结果测距 Mechantronic Bao Halcon 机器视觉计算机视觉图像处理视觉检测
Halcon相机标定及导出标定板实际圆心距离（Halcon学习笔记）首先，采集一组标定板不同位姿图片，利用Halcon标定助手进行标定。在Halcon标定助手中可以通过勾选使用示例中“将测量结果变换到世界坐标系中”导出标定板其中两点中心距。以下为手工编写测两点中心距程序的流程：在此基础上，如下所示，在标定板放置平面上放置一把游标卡尺，测量卡尺上每两个1之间的实际距离：实验测量距离分别为10.118
Halcon齿轮测量 Mechantronic Bao Halcon 机器视觉视觉检测图像处理计算机视觉
Halcon齿轮测量（Halcon学习笔记）齿轮灰度图像如下：Halcon齿轮测量设计流程首先进行阈值分割并利用面积特征选取出齿轮部分：创建圆的XLD轮廓：进行尺寸测量：生成测量结果并显示：Halcon代码如下：*ImageAcquisition01:CodegeneratedbyImageAcquisition01read_image(Image,'D:/机器视觉学习资料/Halcon学习/案例
halcon学习笔记--图像数据结构，connection和opening算子使用注意事项 lfw2019 机器视觉 halcon
一、机器视觉应用中的三种基本数据结构：1、图像2、区域3、轮廓亚像素轮廓比图像像素分辨率精度更高，亚像素数据可以通过亚像素阈值分割或亚像素边缘提取来获得二、write_image(Image::Format,FillColor,FileName:)按指定格式保存图片，可将图片保存在本地。三、write_region()将区域保存在本地四、tuple_concat(::T1,T2:Concat)将两
Halcon学习笔记02——透视形变的车牌识别 weixin_43710224 Halcon学习笔记图像识别
1程序流程整体流程如下图所示：首先通过RGB→HSV在颜色空间进行Blob分析提取车牌区域，提取区域如下图所示：可以发现图片出现了透视变换，由于拍摄视角未正视车牌，因此矩形的车牌变成了斜四边形。因此需要对该区域进行透视变换，其核心算子如下：获取变换矩阵：hom_vector_to_proj_hom_mat2d(::Px,Py,Pw,Qx,Qy,Qw,Method:HomMat2D)其中Px，Py分
HALCON学习笔记工大陈机器视觉 halcon 学习算法
一、第一个halcon程序初次接触视觉算法，对很多概念还是一个很模糊的状态。第一次使用halcon，根据B站联为智能教育的教学视频进行学习记录1.读取图片*Readinganimage:read_image(Image,'mreut')*Reading3imagesintoanimagearray:read_image(Images,['ic0','ic1','ic2'])HALCON算子:rea
HalCon学习笔记工大陈机器视觉 halcon 学习 c++
一、连接相机算子open_framegrabber：连接相机并设置一些基本的采集参数，如选择相机类型和指定采集设备Parameters:1.HorizontalResolution：水平相对分辨率，如果是1，说明采集的图宽度和原图一样大，是2，表示采集的图宽度是原图的两倍，默认为12.VerticalResolution：垂直相对分辨率，如果是1，说明采集的图宽度和原图一样大3.ImageWidt
HALCON学习笔记（五）——图像分割 weixin_45482443 HALCON
图像分割：将图像中具有特殊意义的不同区域划分开来，这些区域是不交互的。一般采用的图像分割方法有阈值分割，边缘检测，区域生长，霍夫变换等。阈值分割阈值分割：按图像灰度幅度进行分割的方法，把图像的灰度分成不同的等级，然后用设置灰度阈值的方法确定有意义的区域或要分割物体的边界。难点：无法确定图像分割生成区域的数目阈值的确定（阈值选取过高，容易把大量的目标误判为背景；阈值选取过低，容易把大量的背景误判为目
halcon学习笔记4-字符识别（包括汉字识别）丶听涛 halcon 计算机视觉图像识别 ocr
本篇笔记着重写的是如何训练汉字字符，让电脑能够识别出来汉字1.使用系统训练好的文件完成车牌的识别首先我在网上随便找了一直车牌图像然后灰度化再进行阈值操作下一步连通区域后进行特征选择，因为识别中文要训练，这里就先识别英文和数字，后面会有中文的识别详解。因为这里的车牌看起来跟基本是水平的，就不用矫正了。识别前需要将灰度图反转一下（因为我选的字体’Industrial_0-9A-Z_NoRej.omc’
halcon学习笔记 beaconlight halcon
API:erision_circle()opening_clrcle()腐蚀命令对原图像信息的丢失比open命令更为严重select_shape()dev_close_window()dev_open_window()需要在窗口显示信息前需要进行这两部操作，获取窗口ID图片处理一般流程采集》预处理（去噪声）》特征处理API:decompose3将一张图装换成三个色域的图Convertathree-
Halcon学习笔记之测量系列-卡尺测量小丶锦计算机视觉图像处理图像识别
介绍完简单的一维测量之后，下面我们来介绍下常用的卡尺测量。Halcon中的Metrology方法即为卡尺工具，可用来拟合线，圆，这种方法对于目标比背景很明显的图像尺寸测量是很方便的，不需要用blob进行边缘提取等，但缺点也很明显，需要目标的相对位置基本不变才行。大致的步骤如图所示：下面我直接用代码来演示，如何用halcon进行卡尺测量。供测量用的图像如下。代码如下：read_image(Image
[Halcon学习笔记]标定常用的Halcon标定板规格及说明 halcon
1、介绍大多数标定的要求都是以实心圆或方格来作为标志点，所以一般的标定板为棋盘格或矩阵圆点图，高精度的相机标定过程中，大多是以比较明确的特征点来作为参考，所以通过识别标定板的圆形，拟合出精确的中心位置，然后再通过已知的标定模板参数来消除投影造成的形心误差。2、标定板规格标定板的大小要大于全视野的1/3，小于全视野，一般建议使用2/3视野大小的标定板，而且标定板要靠近视野中心，这样中心有效区域的标定
[Halcon学习笔记]机器视觉缺陷检测常用方法对比总结 halcon
1、介绍缺陷检测时机器视觉需求中最复杂难度较大的一类需求。究其原因，主要是在项目开发过程中首先要保证检测的稳定性和精度，又要实现缺陷检测的通用性，常见的缺陷：凹凸、污点瑕疵、划痕、裂缝、伤痕、毛刺等等类型种类繁杂，缺陷检测不同于尺寸、二维码、OCR识别等算法。后者的应用场景比较单一，基本使用一些成熟的算法实现，最多增加一些定位、图像增强的算法，应用门槛相对较低，也比较容易做成通用的产品或工具。但缺
Halcon学习笔记之定位测量项目案例 J。in 图像处理机器视觉计算机视觉图像处理图像识别
前面我已经逐个介绍了一维测量，卡尺测量以及相关的模板匹配内容，那么这篇文章呢，我们就完整的介绍下如何去使用模板匹配和测量去完成一个简单的测量项目，这里还是只介绍像素精度的情况下的，有关相机标定的内容后面会单独讲解，话不多说了，我们直奔主题！原图如下(这也是halcon里面案例的图片集)：代码如下：read_image(Image,'C:/Users/Public/Documents/MVTec/H
Halcon学习笔记之模板匹配-基于形状的多模板匹配小丶锦图像处理机器视觉图像识别图像处理计算机视觉
基于形状的模板匹配在我们实际的项目中应用最广，同时在一些项目中，光是选中一个目标作为匹配的模板，效果可能还达不到我们所需要达到的要求或者我们所需要检测的目标存在多个特征需要去判别，所以这个时候可以考虑多模板匹配，以增加特征的个数来提高精度或者去得到所需要查找的多个不同特征目标。直接上原图，供创建模板的图片：代码如下：read_image(Image,'C:/Users/Administrator/
Halcon学习笔记之模板匹配-基于形状的匹配小丶锦图像识别图像处理计算机视觉
上篇文章主要介绍的是基于形状的匹配的算子各个参数所具备的作用，这篇文章主要介绍下如何在halcon中去使用这些算子完成基于形状的情况下找到我们的目标，同时我们也介绍下适用于缩放的模板查找。模板图片如下：代码如下：read_image(Image,'C:/Users/Administrator/Desktop/基于形状的匹配/1.jpg')rgb1_to_gray(Image,GrayImage)d
Halcon学习笔记之OCR系列-环形字符，斜体字 J。in 机器学习 ocr
这篇文章主要是介绍下我经历的一些比较难已提取OCR部分的图片，从而介绍下一些特别的处理方式。第一种：差分高斯diff_of_gauss(近似拉普拉斯高斯)原图如下：一般的方法基本提取不出来相应的字符。那我们可以通过差分高斯这个算子直接得出很好的效果图，代码以及效果图如下：read_image(Image,'C:/Users/Administrator/Desktop/3.bmp')rgb1_to_
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

Halcon学习笔记（九）——OCR实战练习 倾斜日期检测、倒着的字符检测