Tesseract学习(一)

    最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。

    官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点此处

             识别过程大概可以分为以下几个步骤:

        1.下载tesseract-ocr-3.02.exe,并安装。

        2.打开cmd命令框,键入tesseract可以查看使用说明:Usage

           Tesseract学习(一)_第1张图片

其中imagename 为图片路径,outputbase为输出文本路径,默认保存为txt格式  ,lang为语言包路径 ,pagesegmode为识别方式,下面介绍有不同数字代表的含义。

      3.键入键入:

      (可省略“-l eng”,默认使用的就是安装包中tessdata中的英文语言包,另外图片必须给出后缀,输出路径不要写txt)。

        下面以一张图片为例演示识别过程:

      Tesseract学习(一)_第2张图片    -〉待识别的图片(在D盘根目录)

         Tesseract学习(一)_第3张图片

     4.进入D盘,发现有一个1.txt的文件,打开:

Tesseract学习(一)_第4张图片

     这种识别方法满足基本的需求还是没问题的,但如何在程序中使用呢?下篇博客将介绍如何在程序中调用客户端程序。


你可能感兴趣的:(图像识别)