图片识别 - TesseractOCR

      一直以来,图片识别对我来说是很高深的东西,一直未曾涉猎,有幸在Python是了解到TesseractOCR,终于有个系统的了解,这个能做什么,那就太多了,验证码识别、车牌识别、证件识别等等。

目录

软件的特点

软件的安装

命令行测试

强大在于可以学习

       学习工具jTessBoxEditor

      Tesseract训练


软件的特点

       一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

软件的安装

      源码地址为:https://github.com/tesseract-ocr/tesseract

      EXE可执行文件下载地址(4.0.0):https://download.csdn.net/download/madeinjack/10707268

      EXE安装步骤及注意:(下载后默认双击安装)

          图片识别 - TesseractOCR_第1张图片

           上方可以选择其他语言,支持几十种语言,我选择的是第一个和中文简体及繁体,默认英文是自动安装的。

            图片识别 - TesseractOCR_第2张图片

             由于选择了其他语言,所以会多出这个下载,你也可以不选,但选择的话需要联网下载(中文简体:>40M,繁体:>50M)。

命令行测试

       别人的文章说安装完会自动加入环境变量,我安装后并未加入,直接切换到安装目录(建议手动加入到环境变量),直接执行:tesseract,显示下图表示安装完成:

          图片识别 - TesseractOCR_第3张图片

    准备一张图片如:test.png (如下图),我设置了环境变量,并将这个图片放到D盘根目录。

图片识别 - TesseractOCR_第4张图片

      

       打开D盘生成的output_1.txt发现:162408

遗憾,我上图用的是另一博客的图,他是3.x版本,6识别成了5,4.0我也安装了math包直接就识别出来了。

 

强大在于可以学习

       学习工具jTessBoxEditor

             配套训练工具 jTessBoxEditor 来训练样本,特别用于验证码的识别。

      Tesseract训练

                训练的思路是:1、安装jTessBoxEditor > 2、获取样本文件 > 3、Merge合并样本文件 > 4、生成Box文件 > 5、定义字符配置文件 > 6、字符矫正 > 7、执行批处理文件 > 8、将生成的trainegddata放入tessdata中。

                总结:根据范本生成一个语言包,转换时可指定这个语言包即可。

 

 

 

 

你可能感兴趣的:(Python,python之道,图片识别,jTessBoxEditor,TesseractOCR,OCR)