hongel110

运用tesseract3.05进行字符识别

一下内容转载自

http://blog.csdn.net/u011607273/article/details/78329830

https://www.cnblogs.com/zhongtang/p/5555950.html

Tesseract OCR 3.05.01 VS2015编译及字库训练

tesseract-ocr 源码
https://github.com/tesseract-ocr/tesseract
tesseract-ocr build it from source for windows（windows 源码编译）
https://github.com/tesseract-ocr/tesseract/wiki/Compiling#windows
Tesseract OCR 3.05.01 exe安装文件下载地址
http://download.csdn.net/download/u011607273/10037974
下面说正事

一、最新版本 Tesseract OCR EXE文件生成
1、下载vs2015工程文件
https://github.com/peirick/VS2015_Tesseract
2、下载对应版本的tesseract ocr源码并放入vs2015工程对应文件夹
https://github.com/tesseract-ocr/tesseract或https://github.com/UB-Mannheim/tesseract
3、下载leptonica 源码并放入vs2015工程对应文件夹内
https://github.com/DanBloomberg/leptonica
4、用vs2015或更高版本打开工程进行编译
注意：如果出现缺少文件请查看tesseract ocr或leptonica 源码版本是否匹配，
如果缺少strcasestr.cpp请到tesseract ocr4.0源码中对应文件下获取，
如遇到乱码问题将乱码文件重新保存为工程编码格式GB2312或UTF-8
5、添加变量TESSDATA_PREFIX指向tessdata上级目录
注：如果不添加此步骤在图片识别过程中可能报错
6、添加PATH指向tesseract.exe所在文件夹
7、编译成功后运行test_tesseract.bat进行测试。

二、字符识别基础及训练字库
1、下载jTessBoxEditor（需要安装jdk才能使用）
2、准备好需训练的图片
3、将每个需训练的图片进行识别查看识别效果

tesseract 1.jpg 1 // 后面的1为文本文件名称

4、用jTessBoxEditor将jpg转换为tif文件

5、将生成所有的tif文件合成一个tif图片集文件，并规范命名
例如red.font.exp0
重复第四步操作，这次选得是tif文件，记得将所有需要训练的tif文件都选上。

6、生成box文件

tesseract red.font.exp0.tif red.font.exp0 batch.nochop makebox

7、调整，因为 tesseract 识别的不准确，所以我们用 jTessBoxEditor来调整识别文字的位置、结果
用 jTessBoxEditor打开生成的图片集red.font.exp0.tif ,注意red.font.exp0.tif 对应的box文件一定要和他处于同一个文件夹下(请保持文件名)，否则，用jTessBoxEditor打开没有位置、识别结果等信息，然后就可以调整了，调整完之后保存；注意多个tif文件生成的tif图片集在打开后是分页的。

8、生成.tr文件

tesseract red.font.exp0.tif  red.font.exp0   nobatch box.train

9、计算字符集,从生成的 box文件中提取

unicharset_extractor red.font.exp0.box

注意：unicharset_extractor在vs2015项目中是没有的，请下载tesseract3.05.exe安装文件，解压缩exe文件后将除tesseract.exe外的exe文件复制到vs2015中tesseract.exe文件路径下即PATH下。
10、生成字体特征文件
在tif文件夹下创建font_properties.txt 内容
定义字体特征文件，Tesseract-OCR 3.01 以上的版本在训练之前需要创建一个名称为 font_properties 的字体特征文件。font_properties 不含有 BOM 头，文件内容格式如下：

font 0 0 0 0 0

创建后执行命令

mftraining -F font_properties.txt -U unicharset red.font.exp0.tr

11、聚集tesseract 识别的训练文件

cntraining red.font.exp0.tr

执行完这一步之后发现文件夹下生产了许多文件，把unicharset, inttemp, normproto, pfftable,shapetable这几个文件加上前缀 red.
12、最后一步，合并相关文件，生成字典文件

combine_tessdata red.

好了，至此字典文件就生产了，我们把生成的字典文件red.traineddata放入到 vs2015中 tessdata文件夹下开始使用我们训练过得字体库，找到之前的jpg图片测试一下识别成功率

如果想更好的识别图片，可以试试将图片二值化处理，可以提高识别率

利用jTessBoxEditor工具进行Tesseract3.02.02样本训练，提高验证码识别率

1、背景

前文已经简要介绍tesseract ocr引擎的安装及基本使用，其中提到使用-l eng参数来限定语言库，可以提高识别准确率及识别效率。

本文将针对某个网站的验证码进行样本训练，形成自己的语言库，来提高验证码识别率。

2、准备工具

tesseract样本训练有一个官方流程说明，https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract#run-tesseract-for-training，不过都是英文的，个人认为这个地址适合于查找细节问题，全程看E文对大众还是有一定的困难。

具体的方法有两种：1-利用三方工具，2-完全命令行操作，三方工具主要在https://github.com/tesseract-ocr/tesseract/wiki/AddOns下载，本文将用到jTessBoxEditor这个工具，我们先给他下载到本地。

需要特别说明，这个工具是基于java虚拟机运行的，所以我们还要下载并安装一个java虚拟机，下载地址：http://download.oracle.com/otn-pub/java/jdk/8u91-b14/jdk-8u91-windows-x64.exe?AuthParam=1463733597_1161f2d895aa7606ed260b43b83d5f86。

总结一下：

1、工具2 java虚拟机 Ver 1.8.0_91 64位版本（oracle官网）

2、工具1 jtessboxeditor Ver 1.5版本（jtessboxeditor官网），运行界面如下：

3、使用实例

1)、准备样本图片

手动刷新某网站验证码，手动或者写程序，保存了101个验证码样本文件，分别命名成：1.png，2.png，……，101.png。

该验证码有几个特点：a、定长4位，b、都是数字，c、有背景干扰，但比较简单，d、字体为红色。

为了提高识别率，首先做了一个工作就是灰度化处理，并全部转换成tif文件，分别命名成：1.tif，2.tif，……，101.tif，统一存放在d:\python\lnypcg下。

2)、合并样本图片

打开jtessboxeditor，点击Tools->Merge Tiff ，按住shift键选择前文提到的101个tif文件，并把生成的tif合并到新目录d:\python\lnypcg\new下，命名为langyp.fontyp.exp0.tif。

注意：langyp 是本人定义的语言名称，fontyp是本人定义的字体名称，后续都会用到，你可以修改成你喜欢的名字。

3)、生成box文件

执行命令生成langyp.fontyp.exp0.box文件

tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 batch.nochop makebox

D:\python\lnypcg\new>tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 batch.nochop makebox
Tesseract Open Source OCR Engine v3.02 with Leptonica
Page 1 of 101
Page 2 of 101
Page 3 of 101
……
Page 101 of 101

D:\python\lnypcg\new>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 36D9-CDC7

 D:\python\lnypcg\new 的目录

2016-06-03  14:37    <DIR>          .
2016-06-03  14:37    <DIR>          ..
2016-06-03  14:30             6,327 langyp.fontyp.exp0.box
2016-06-03  13:07           126,056 langyp.fontyp.exp0.tif
               2 个文件        132,383 字节
               2 个目录 24,869,994,496 可用字节

4)、修改box文件

切换到jTessBoxEditor工具的Box Editor页，点击open，打开前面的tiff文件langyp.fontyp.exp0.tif，工具会自动加载对应的box文件。

检查box数据，如下图所示，数字8被误认成字母H，手工修改H成8，并保存。

点击下图红色框的按钮，逐个核对tif文件的box数据，全部检查结束并保存。

5)、生成font_properties

执行echo命令生成font_properties。

echo fontyp 0 0 0 0 0 >font_properties

也可以手工新建一个名为font_properties的文本文件（注意该文件没有扩展名），内容为字体名fontyp，后面带5个0，分别代表字体的粗体、斜体等属性，这里全部是0

D:\python\lnypcg\new>echo fontyp 0 0 0 0 0 >font_properties

D:\python\lnypcg\new>type font_properties
fontyp 0 0 0 0 0

6)、生成训练文件

执行命令，生成langyp.fontyp.exp0.tr训练文件

tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 nobatch box.train

D:\python\lnypcg\new>tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 nobatch box.train
Tesseract Open Source OCR Engine v3.02 with Leptonica
Page 1 of 101
row xheight=8.66667, but median xheight = 10
APPLY_BOXES:
   Boxes read from boxfile:       4
   Found 4 good blobs.
Generated training data for 1 words
……
……
……
Page 101 of 101
row xheight=8.66667, but median xheight = 10
APPLY_BOXES:
   Boxes read from boxfile:       4
   Found 4 good blobs.
Generated training data for 1 words

 D:\python\lnypcg\new 的目录

2016-06-03  16:34    <DIR>          .
2016-06-03  16:34    <DIR>          ..
2016-06-03  16:05                16 font_properties
2016-06-03  14:30             6,327 langyp.fontyp.exp0.box
2016-06-03  13:07           126,056 langyp.fontyp.exp0.tif
2016-06-03  16:20           618,844 langyp.fontyp.exp0.tr
2016-06-03  16:20               202 langyp.fontyp.exp0.txt
               5 个文件        751,445 字节
               2 个目录 24,869,101,568 可用字节

7)、生成字符集文件

执行命令，生成名为unicharset的字符集文件。

unicharset_extractor langyp.fontyp.exp0.box

D:\python\lnypcg\new>unicharset_extractor langyp.fontyp.exp0.box
Extracting unicharset from langyp.fontyp.exp0.box
Wrote unicharset file ./unicharset.

D:\python\lnypcg\new>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 36D9-CDC7

 D:\python\lnypcg\new 的目录

2016-06-03  16:41    <DIR>          .
2016-06-03  16:41    <DIR>          ..
2016-06-03  16:05                16 font_properties
2016-06-03  14:30             6,327 langyp.fontyp.exp0.box
2016-06-03  13:07           126,056 langyp.fontyp.exp0.tif
2016-06-03  16:20           618,844 langyp.fontyp.exp0.tr
2016-06-03  16:20               202 langyp.fontyp.exp0.txt
2016-06-03  16:41               712 unicharset
               6 个文件        752,157 字节
               2 个目录 24,869,171,200 可用字节

8)、生成shape文件

执行命令，生成shape文件

shapeclustering -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr

D:\python\lnypcg\new>shapeclustering -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
Reading langyp.fontyp.exp0.tr ...
Building master shape table
Computing shape distances...
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0
Stopped with 0 merged, min dist 999.000000
Computing shape distances...
Stopped with 0 merged, min dist 999.000000
Computing shape distances...
Stopped with 0 merged, min dist 999.000000
Computing shape distances... 0 1 2 3 4 5 6 7 8 9 10
Stopped with 0 merged, min dist 0.057803
Master shape_table:Number of shapes = 11 max unichars = 1 number with multiple unichars = 0

D:\python\lnypcg\new>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 36D9-CDC7

 D:\python\lnypcg\new 的目录

2016-06-03  17:24    <DIR>          .
2016-06-03  17:24    <DIR>          ..
2016-06-03  17:20                19 font_properties
2016-06-03  14:30             6,327 langyp.fontyp.exp0.box
2016-06-03  13:07           126,056 langyp.fontyp.exp0.tif
2016-06-03  17:23           618,844 langyp.fontyp.exp0.tr
2016-06-03  17:23               202 langyp.fontyp.exp0.txt
2016-06-03  17:24               723 langyp.unicharset
2016-06-03  17:24               202 shapetable
2016-06-03  17:24               712 unicharset
               8 个文件        753,085 字节
               2 个目录 24,868,278,272 可用字节

9)、生成聚集字符特征文件

执行命令，生成3个特征字符文件，unicharset、inttemp、pffmtable

mftraining -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr

D:\python\lnypcg\new>mftraining -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
Read shape table shapetable of 11 shapes
Reading langyp.fontyp.exp0.tr ...
Done!

10)、生成字符正常化特征文件

执行命令，生成正常化特征文件normproto。

cntraining langyp.fontyp.exp0.tr

D:\python\lnypcg\new>cntraining langyp.fontyp.exp0.tr
Reading langyp.fontyp.exp0.tr ...
Clustering ...

11)、更名

执行命令，把步骤9，步骤10生成的特征文件进行更名。

rename normproto fontyp.normproto
rename inttemp fontyp.inttemp
rename pffmtable fontyp.pffmtable
rename unicharset fontyp.unicharset
rename shapetable fontyp.shapetable

D:\python\lnypcg\new>rename normproto fontyp.normproto

D:\python\lnypcg\new>rename inttemp fontyp.inttemp

D:\python\lnypcg\new>rename pffmtable fontyp.pffmtable

D:\python\lnypcg\new>rename unicharset fontyp.unicharset

D:\python\lnypcg\new>rename shapetable fontyp.shapetable

12)、合并训练文件

执行命令，生成fontyp.traineddata文件。

combine_tessdata fontyp.

注意：

a、fontyp.traineddata文件最终要拷贝tesseract安装目录的tessdata目录下，才能被tesseract找到。

b、命令行最后必须带一个点。

c、执行结果中，1,3,4,5,13这几行必须有数值，才代表命令执行成功。

D:\python\lnypcg\new>combine_tessdata fontyp.
Combining tessdata files
TessdataManager combined tesseract data files.
Offset for type 0 is -1
Offset for type 1 is 140
Offset for type 2 is -1
Offset for type 3 is 852
Offset for type 4 is 137760
Offset for type 5 is 137850
Offset for type 6 is -1
Offset for type 7 is -1
Offset for type 8 is -1
Offset for type 9 is -1
Offset for type 10 is -1
Offset for type 11 is -1
Offset for type 12 is -1
Offset for type 13 is 139352
Offset for type 14 is -1
Offset for type 15 is -1
Offset for type 16 is -1

13）测试使用

譬如前文的28.tif中8被误认为字母S，用新的字体看是否还出错。

D:\python\lnypcg>tesseract 28.tif output -l eng -psm 7
Tesseract Open Source OCR Engine v3.02 with Leptonica

D:\python\lnypcg>type output.txt
S094
#1调用默认的eng语言，8被识别成S

D:\python\lnypcg>tesseract 28.tif output -l fontyp -psm 7
Error opening data file C:\Program Files (x86)\Tesseract-OCR\tessdata/fontyp.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'fontyp'
Tesseract couldn't load any languages!
Could not initialize tesseract.
#2条用新的fontyp语言，tesseract找不到fontyp语言。

D:\python\lnypcg>copy .\new\fontyp.traineddata "C:\Program Files (x86)\Tesseract-OCR\tessdata"
已复制         1 个文件。
#3复制fontyp.traineddata到tesseract的安装目录的tessdata子目录下


D:\python\lnypcg>tesseract 28.tif output -l fontyp -psm 7
Tesseract Open Source OCR Engine v3.02 with Leptonica

D:\python\lnypcg>type output.txt
8094
#使用fontyp语言成功识别8094

4、总结：

Anyway，jtessboxeditor 工具其实是一个基本成型的三方样本训练工具，它的功能就是自动执行上述脚本命令，但是在实际使用中，还存在不够完善的地方，譬如不能加psm参数，生成shape时经常程序异常崩溃，所以本文操作还是以命令行为主。

tesseract是一个非常强大的ocr引擎，尤其是做了针对性训练之后，验证码识别率几乎可以达到95%以上，再在程序中增加一些判断机制，基本上可以满足爬虫自动登陆需求了，回头写一个某东的自动识别验证码的爬虫程序。

把前文提的简化一下，综合成如下步骤列表：

1、合并图片
2、生成box文件
tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 batch.nochop makebox
3、修改box文件
4、生成font_properties
echo fontyp 0 0 0 0 0 >font_properties
5、生成训练文件
tesseract langyp.fontyp.exp0.tif langyp.fontyp.exp0 -l eng -psm 7 nobatch box.train
6、生成字符集文件
unicharset_extractor langyp.fontyp.exp0.box 
7、生成shape文件
shapeclustering -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
8、生成聚集字符特征文件
mftraining -F font_properties -U unicharset -O langyp.unicharset langyp.fontyp.exp0.tr
9、生成字符正常化特征文件
cntraining langyp.fontyp.exp0.tr
10、更名
rename normproto fontyp.normproto
rename inttemp fontyp.inttemp
rename pffmtable fontyp.pffmtable 
rename unicharset fontyp.unicharset
rename shapetable fontyp.shapetable
11、合并训练文件，生成fontyp.traineddata
combine_tessdata fontyp.

以上！

机器视觉_联合编程(二) Zhangci］ VisionPro 数码相机计算机视觉人工智能 VisionPro 机器视觉
链接相机,加载tb,检测FrameGrabber链接相机拍照usingSystem;usingSystem.Collections;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;usingSystem.Text;usin
EI检索-机器视觉、图像处理与影像技术国际学术会议（MVIPIT 2023）邀您参会！诗远Yolanda 图像处理人工智能计算机视觉
机器视觉是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。而图像处理等技术的快速发展也推动了机器视觉的发展。机器视觉在我国具有广泛的工业应用，核心功能包括：测量，检测，识别，定位等。第一届机器视觉、图像处理与影像技术国际学术会议（MVIPIT2023）将于2023年7月26日-28日在浙江杭
学习Halcon可以从以下几个方面入手视觉人机器视觉机器视觉Halcon大总结学习人工智能深度学习图像处理计算机视觉视觉检测
‌基础理论学习‌：‌了解Halcon的基本概念、‌架构和主要技术，‌包括图像处理、‌机器视觉、‌深度学习等方面的知识。‌‌官方文档和教程‌：‌阅读Halcon的官方文档和教程，‌这是学习Halcon最直接、‌最权威的途径。‌官方文档详细介绍了Halcon的各种功能和算子，‌是学习Halcon不可或缺的资源。‌‌实践项目‌：‌通过参与实际项目来巩固所学知识，‌提升实践能力。‌可以从简单的项目开始，‌
最新2024年国际EI会议集合 AC学术中心 EI论文
最新2024年国际EI会议集合，要说哪个渠道录用最快，当属EI会议，最快1个月录用，超级快的可能仅需15天，非常适合计算机、机械、工程技术等理工科方向。除了录用周期的优势外，EI会议相较于SCI、EI源刊、国内核心等价格更便宜，几千元即可发表EI会议论文。下面AC学术中心给大家介绍一下近期要举办的EI会议。第二届机器视觉、图像处理与影像技术国际会议（MVIPIT2024）会议时间：2024年9月1
acm会议什么档次_盘点AI国际顶级会议 weixin_39531992 acm会议什么档次
人工智能(英文全称ArtificialIntelligence,缩写为AI)从其字面意思理解是由人制造出来在机器上体现出的类似于人类的智能，其技术研究包含机器视觉、机器学习、自然语言处理、机器运动和控制等众多方面。如同四大时装周是世界时尚潮流的风向标，人工智能领域的国际顶尖会议也往往汇集了人工智能各分支技术的最新发展状态和未来发展方向。今天，小编就来为大家盘点一下人工智能领域的国际顶级会议。\\\
【机器视觉--光学】工业相机成像原理 Vision Z 机器视觉镜头工业相机机器视觉
相机成像原理分为透镜成像原理和小孔成像原理，工业相机原理与透镜成像类似。透镜成像原理凸透镜的成像规律是即：物距的倒数与像距的倒数之和等于焦距的倒数对焦原理工业相机镜头分为定焦、定倍、变焦镜头，常用的是定焦和定倍，定倍镜头调整相距，达到清晰的成像，根据上面的公式，想要得到远处清晰的成像，镜片组到芯片距离需要增加，想要得到近距离的成像时，镜片组到芯片距离需要减小。定倍镜头放大倍数已知，工作距离已知，安
关于光源的明场和暗场照明 InvokeLife 机器视觉光源
明场：光源与被测物成一定角度，使得绝大部分的光反射到摄像机，我们称作明场照明[1]。暗场：光源位置使得大部分的光没有反射到摄像机，仅仅将照射到被测物的特定部分的光反射到摄像机，我们称此种照明为暗场照明[1]。如下，明场和暗场的示意图[2]。根据直射、漫射，以及正面背面还可以再分。未完待续。[1]《机器视觉算法与应用》第二版[2]《默然光源选型手册》
机器视觉-4 检测原理之OpenCV Blob特征检测 dingkm666 机器视觉计算机视觉人工智能深度学习
在OpenCV中，BLOB（BinaryLargeOBjects）检测是一种用于识别和分析二值图像中连通区域的技术。OpenCV提供了专门的工具类SimpleBlobDetector来帮助实现这一功能。以下是关于OpenCV中BLOB检测的详细说明，包括其原理、使用方法和应用场景。一.什么是BLOB？在图像处理的背景下，BLOB指的是图像中颜色一致且连接在一起的像素区域。在二值图像中，这些区域通常
机器视觉-1 常用的机器视觉开发库 dingkm666 机器视觉机器学习
机器视觉-1常用的机器视觉开发库前言：工欲善其事必先利其器，选择一个合适的视觉开发库是在机器视觉领域的发展的重要基础。1.OpenCV（OpenSourceComputerVisionLibrary）简介:OpenCV是最著名和最广泛使用的开源计算机视觉库之一。由Intel于1999年开发，目前由OpenCV.org维护，支持C++、Python、Java和MATLAB等多种编程语言。功能:图像处
工业相机参数之帧率相关知识详解小白学视觉人工智能 java python 计算机视觉编程语言
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达工业相机是机器视觉系统的重要组成部分之一,在机器视觉系统中有着非常重要的作用。工业相机已经被广泛应用于工业生产线在线检测、智能交通,机器视觉,科研,军事科学,航天航空等众多领域。工业相机的主要参数包括:分辨率、帧率、像素、像元尺寸、光谱响应特性等。下面我们来对工业相机帧率的相关知识进行讲解:帧率(Framerate)是用于测量显
机器视觉按需求选择工业相机的方法鸦芽_hujiamei 图像处理机器视觉机器视觉相机选择
信号工业相机的信号类型有模拟信号和数字信号两种。模拟相机必须有图像采集卡，标准的模拟相机分辨率很低，采集到的是模拟信号，经数字采集卡转换为数字信号进行传输存储。工业数字相机采集到的是数字信号，数字信号不受电噪声影响，因此，数字相机的动态范围更高，能够向计算机传输更精确的信号。分辨率根据具体需求来选择相机分辨率的大小，如果一个像素对应一个缺陷的话，那么这样的系统一定会极不稳定，所以我们为了提高系统的
工业相机测长仪的组成部分蓝鹏测控自动化制造其他
关键字:工业相机测长仪,高精度测长仪,视觉测量系统,蓝鹏测控测长仪,工业测长仪,本文介绍了蓝鹏测控公司机器视觉业务测长仪的核心产品及技术特点，主要涵盖相机部分、相机防护系统、补光系统和软件部分。（一）相机部分我司的机器视觉业务聚焦工业视觉传感应用，专注光学技术、嵌入式硬件技术和底层算法软件，为客户提供领先的机器视觉硬件产品和算法平台。公司拥有成熟的研发及质量管控体系，从设计源头确保每一款产品的高品
视觉系统的革新：嵌入式AI摄像头 7aa5938c2f5f
学号：17050610006姓名：韦运泽文章链接：https://mp.weixin.qq.com/s/VzuM-ewcCu88D7nYjeE3BQ功能强大的精简型单板计算机的推出带动了一些新产品的设计，在通过小型化优化成本及效率的应用中，它的效用尤为明显。另外，视觉系统可以利用功能全面的板级机器视觉摄像头进一步缩小产品总体尺寸并实现运行灵活性，同时还支持定制或非标准光学部件。它们被用于：医疗诊断
国内十大AGV厂家排行互联网之声人工智能大数据
国内agv机器人公司排名1.海康机器人成立时间：2016年4月20日海康机器人成立于2016年。杭州的一家机器人技术公司主要从事移动机器人、机器视觉、无人机等领域的业务。到目前为止，它还拥有许多专利产品，并一直为世界提供许多相应的产品和结局计划。2.坤厚机器人成立时间：坤厚自动化科技有限公司成立于2015年，从成立至今申请了多项发明及实用新型专利，并且拥有国内领先的AGV技术，紧密结合市场应用需求
什么是计算机视觉？龙腾AI 计算机视觉人工智能自然语言处理深度学习 ai
计算机视觉概述计算机视觉（ComputerVision）又称机器视觉（MachineVision），是一门让机器学会如何去“看”的学科，是深度学习技术的一个重要应用领域，被广泛应用到安防、工业质检和自动驾驶等场景。具体的说，就是让机器去识别摄像机拍摄的图片或视频中的物体，检测出物体所在的位置，并对目标物体进行跟踪，从而理解并描述出图片或视频里的场景和故事，以此来模拟人脑视觉系统。因此，计算机视觉也
嵌入式机器视觉的流水线分拣机器人：OpenCV、 FreeRTOS、 TensorFlow（代码详解）极客小张机器人 opencv tensorflow stm32 系统架构计算机视觉物联网
一、项目概述在现代自动化生产中，分拣机器人作为提高生产效率和准确度的重要工具，正逐渐成为工业流水线的核心组成部分。本项目旨在设计一款基于嵌入式机器视觉的流水线分拣机器人，通过高效的图像处理与实时控制技术，实现对物品的快速识别与自动分拣。该项目的主要目标包括：提高分拣精度：通过高效的机器视觉算法，确保机器人能够准确识别不同类型的物品。提升作业效率：利用实时操作系统和嵌入式AI推理引擎，实现快速响应与
简述Ifocus自动对焦模块 51camera 机器视觉视觉检测视觉系统
在2024上海机器视觉展中，51camera的合作厂商iCore展出的自动对焦模块吸引不少观众驻足，那么什么是自动对焦呢？顾名思义，是指被测物的成像平面偏离了镜头的焦距范围，导致成像模糊，利用辅助装置可使成像平面重新回到镜头最佳焦距范围。自动对焦的作用？首先我们先了解一下“景深”，景深（DepthofField,DOF）是关于空间中可以清晰成像的距离范围，镜头对焦面物体拍摄时，背景虚化，对焦背景时
iLight混合点光源激光与LED技术的结合 51camera LED光源视觉系统视觉检测
51camera机器视觉产品资料查询平台的光源种类比较丰富，今天我们一起来看看其合作厂商iCore的明星产品iLight混合点光源，该产品提供了比LED更高的亮度，作为传统LED和氙气灯的替代品，它将激光和LED技术的结合，提供了长达10,000小时的寿命，没有氙气灯短寿命和亮度波动的缺点。iLight混合光系统由一个大功率光源控制器和一个专门为机器视觉应用设计的混合光组成。它具有高速控制和高效运
加速自动驾驶模型迭代，数据存算一体是关键 virtaitech OrionX 自动驾驶人工智能机器学习 AI AI算力资源池化科技 OrionX
自动驾驶的每一个业务阶段都会涉及到AI深度学习算法和算力的参与，机器视觉，深度学习，传感器技术等均在自动驾驶领域发挥着重要的作用。自动驾驶系统不断迭代的前提是算法的持续优化，目前，自动驾驶发展的瓶颈主要在于AI底层技术和AI算力发展水平上能否实现突破。近日，焱融高性能分布式文件存储系统YRCloudFile联合趋动科技OrionXAI算力资源池化软件与GeminiAI开发训练平台，共同打造自动驾驶
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
软件杯深度学习 opencv python 公式识别(图像识别机器视觉) Mr.D学长 python java
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
计算机设计大赛行人重识别(person reid) - 机器视觉深度学习 opencv python iuerfee python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
挑战杯基于设深度学习的人脸性别年龄识别系统 laafeer python
文章目录0前言1课题描述2实现效果3算法实现原理3.1数据集3.2深度学习识别算法3.3特征提取主干网络3.4总体实现流程4具体实现4.1预训练数据格式4.2部分实现代码5最后0前言优质竞赛项目系列，今天要分享的是基于深度学习机器视觉的人脸性别年龄识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/po
互联网加竞赛机器视觉目标检测 - opencv 深度学习 Mr.D学长 python java
文章目录0前言2目标检测概念3目标分类、定位、检测示例4传统目标检测5两类目标检测算法5.1相关研究5.1.1选择性搜索5.1.2OverFeat5.2基于区域提名的方法5.2.1R-CNN5.2.2SPP-net5.2.3FastR-CNN5.3端到端的方法YOLOSSD6人体检测结果7最后0前言优质竞赛项目系列，今天要分享的是机器视觉opencv深度学习目标检测该项目较为新颖，适合作为竞赛课题
挑战杯基于机器视觉的图像拼接算法 laafeer python
前言图像拼接在实际的应用场景很广，比如无人机航拍，遥感图像等等，图像拼接是进一步做图像理解基础步骤，拼接效果的好坏直接影响接下来的工作，所以一个好的图像拼接算法非常重要。再举一个身边的例子吧，你用你的手机对某一场景拍照，但是你没有办法一次将所有你要拍的景物全部拍下来，所以你对该场景从左往右依次拍了好几张图，来把你要拍的所有景物记录下来。那么我们能不能把这些图像拼接成一个大图呢？这是一个较为新颖的竞
挑战杯基于机器视觉的火车票识别系统 laafeer python
文章目录0前言1课题意义课题难点：2实现方法2.1图像预处理2.2字符分割2.3字符识别部分实现代码3实现效果最后0前言优质竞赛项目系列，今天要分享的是基于机器视觉的火车票识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题意义目前火车乘务员在卧铺旅客在上车前为其提供将火车
挑战杯基于机器视觉的二维码识别检测 - opencv 二维码识别检测机器视觉 laafeer python
文章目录0简介1二维码检测2算法实现流程3特征提取4特征分类5后处理6代码实现5最后0简介优质竞赛项目系列，今天要分享的是基于机器学习的二维码识别检测-opencv二维码识别检测机器视觉该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1二维码检测物体检测就是对数字图像中一类特定的物体
计算机设计大赛深度学习人体跌倒检测 -yolo 机器视觉 opencv python iuerfee python
0前言优质竞赛项目系列，今天要分享的是**基于深度学习的人体跌倒检测算法研究与实现**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1.前言人体跌倒是人们日常生活中常见姿态之一，且跌倒的发生具有随机、难
计算机设计大赛深度学习人脸表情识别算法 - opencv python 机器视觉 iuerfee python
文章目录0前言1技术介绍1.1技术概括1.2目前表情识别实现技术2实现效果3深度学习表情识别实现过程3.1网络架构3.2数据3.3实现流程3.4部分实现代码4最后0前言优质竞赛项目系列，今天要分享的是深度学习人脸表情识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：https://gite
巡检机器人与机器视觉的融合：巡检运维的未来趋势超维机器人机器人运维人工智能大数据计算机视觉
2023世界机器人大会的数据显示，中国工业机器人装机量已经占据了全球市场的超过50%的比重，成为全球最大的工业机器人市场。巡检机器人作为一种高度复杂的自动化装置，被广泛应用于工业领域，能实现各种工业场景下智能巡检运维，推动传统产业智能化改造和数字化转型；因其在智能巡检运维领域占据重要地位，被誉为“皇冠上的明珠”。机器视觉技术使得智能巡检机器人能够自动检测目标物体、识别设备状态、发现异常情况，并采取
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs