安装Tesseract-3.04.00

1.编译安装
    a.编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) 
     sudo yum install gcc gcc-c++ make 
    b.安装tesseract-ocr编译必须的包
     sudo yum install autoconf automake libtool
    c.增加图像解析需要的包,可以按照指定的格式选择包
     sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel


2.安装leptonica
wget http://www.leptonica.org/source/leptonica-1.73.tar.gz 
tar zxvf leptonica-1.73.tar.gz
cd leptonica-1.73
./configure     #注意:没做configure之前是没有Makefile文件的,之后才生成的
make 
sudo make install    #默认安装到了/usr/local/lib 下面,是一些静态库和动态库文件;头文件默认位于/usr/local/include/leptonica


3.安装Tesseract
sudo wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.05.00.tar.gz  Tesseract3.04.00.tar.gz
tar -zxvf Tesseract3.04.00.tar.gz  
cd tesseract-3.04.0
./autogen.sh  #用来生成configure文件
./configure 
make 
sudo make install     #默认安装到 /usr/local/include、 /usr/local/lib 和 /usr/local/bin/ 下面
sudo ldconfig    #这步操作别忘了


在 3.03 及以上版本中,用于训练产生语言文件的工具需要单独编译和安装:
make training
sudo make training-install


4.下载字体库
cd /usr/local/tesseract/share/tessdata
sudo wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
sudo wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
sudo wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata 
  环境变量设置
vim ~/.bash_profile
export TESSDATA_PREFIX=/usr/local/share/tessdata/tessdata
export PATH=$PATH:$TESS_ROOT/bin

重启云服务器或者source ~/.bash_profile使环境变量生效
cd leptonica-1.73/tesseract-3.04.00/testing
 命令行:
tesseract phototest.tif protest -l eng
 输出:
Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Page 1

你可能感兴趣的:(验证码识别)