在tesseract-ocr中会用到leptonica库,这里对leptonica简单介绍下。
Leptonica是一个开源的图像处理和图像分析库,它的license是BSD 2-clause。它主要包括的操作有:位图操作、仿射变换、形态学操作、连通区域填充、图像变换及像素掩模、融合、增强、算术运算等操作。
在使用Leptonica的时候,它依赖于开源的zlib、libjpeg、libpng、libtiff、giflib。
zlib是一个很好的压缩、解压缩库。它的license是zlib授权,类似BSD。
libjpeg是一个完全用C语言编写的库,包含了被广泛使用的JPEG解码、JPEG编码和其它的JPEG功能的实现。它的license类似BSD。
libpng是官方的PNG参考库,它支持几乎所有的PNG功能,它也是可扩展的。它使用zlib库作为压缩引擎。它的license是permissive free software license,类似BSD。
libtiff是一个用来读写TIFF文件的开源库,它依赖于libjpeg和zlib。它的license是BSD。
giflib是一个读、写GIF图像的开源库,它的license类似BSD。
下面详细介绍Leptonica的编译步骤:
1. 从http://www.zlib.net/ 下载最新的zlib-1.2.8源码,新建zlib静态库工程,将/zlib-1.2.8目录下的.h、.c文件加入到此工程中,编译生成zlib静态库;
2. 从http://www.libpng.org/pub/png/libpng.html下载最新的libpng-1.6.16,新建libpng静态库工程,将/lpng1616目录下的.h、.c文件加入到此工程中,将/lpng1616/scripts目录下的pnglibconf.h.prebuilt文件拷贝到/lpng1616目录下,并修改文件名为pnglibconf.h,将此文件也加入到此工程中,将pngstruct.h文件中zlib.h改成正确的存放路径,编译生成libpng静态库;
3. 从http://www.ijg.org/files/ 下载最新的jpeg-9a源码,新建ligjpeg静态库工程,将/jpeg-9a目录下的.h、.c文件加入到此工程中(jmemdos.c和jmemmac.c文件除外),将jconfig.vc重命名为jconfig.h,将此文件也加入到此工程中,编译生成libjpeg静态库;
4. 从ftp://ftp.remotesensing.org/pub/libtiff下载稳定版的tiff-4.0.3源码,新建libtiff静态库工程,将/tiff-4.0.3/libtiff目录下相应的.h、.c文件加入到此工程中,将tiff_config.vc.h、tiffconf.vc.h分别重命名为tiff_config.h、tiffconf.h,将此两个文件也加入到此工程中,编译生成libtiff静态库;
5. 从http://sourceforge.net/projects/giflib/下载最新的gitlib-5.1.1源码,新建giflib静态库工程,将/giflib-5.1.1目录下相应的.h、.c文件加入到此工程中,对源文件进行调整,将源文件中用到#include <stdbool.h>的地方,用以下语句替换,
//#include <stdbool.h> #ifndef __cplusplus typedef int bool; #define false 0 #define true 1 #endif
将文件中用到的#include<unistd.h>的地方均注释掉,编译生成giflib静态库;
6. 从http://www.leptonica.org/download.html下载最新的leptonica-1.71源码,新建liblept静态库工程,将/leptonica-1.71/src目录下相应的.h、.c文件加入到此工程中,调整:(1)、将zlib、libtiff、libpng、gif_lib.h、jpeglib.h相关头文件通过工程配置(C/C++-->Additional Include Directories)加入到此工程;(2)、将environ.h文件中的#defineHAVE_LIBGIF 0改为#define HAVA_LIBGIF 1 使其支持Gif图像格式;(3)、有些文件会出现奇怪的C2275和C2146错误,解决方法,找到出错处,将所有变量的声明放在函数的开头即可;(4)、有些文件会出现奇怪的C2057错误,解决方法,注释掉类似的static const l_int32 L_BUF_SIZE = 52;新建一个redefineconstant.h文件,将此文件包含到出现此问题的文件中,redefineconstant.h文件的内容为:
#ifndef _REDEFINE_CONSTANT_H #define _REDEFINE_CONSTANT_H #include "allheaders.h" #define L_BUF_SIZE 512 #define MAX_ALLOWED_DILATION 25 #endif // _REDEFINE_CONSTANT_H
7. 新建liblepttest控制台工程,对liblept库进行简单测试,相关文件代码如下:
stdafx.h:
#pragma once #include "targetver.h" #include <stdio.h> #include "../../../ImgCore/src/zlib/zlib-1.2.8/zlib.h" #include "../../../ImgCore/src/libpng/lpng1616/png.h" #include "../../../ImgCore/src/libjpeg/jpeg-9a/jpeglib.h" #include "../../../ImgCore/src/libtiff/tiff-4.0.3/libtiff/tiff.h" #include "../../../ImgCore/src/giflib/giflib-5.1.1/lib/gif_lib.h" #include "../../src/leptonica-1.71/src/allheaders.h"
#include "stdafx.h" // TODO: reference any additional headers you need in STDAFX.H // and not in this file #ifdef _DEBUG #pragma comment(lib, "../../../../ImgCore/lib/dbg/x86_vc10/zlib[dbg_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/dbg/x86_vc10/libpng[dbg_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/dbg/x86_vc10/libjpeg[dbg_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/dbg/x86_vc10/libtiff[dbg_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/dbg/x86_vc10/giflib[dbg_x86_vc10].lib") #pragma comment(lib, "../../../lib/dbg/x86_vc10/liblept[dbg_x86_vc10].lib") #else #pragma comment(lib, "../../../../ImgCore/lib/rel/x86_vc10/zlib[rel_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/rel/x86_vc10/libpng[rel_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/rel/x86_vc10/libjpeg[rel_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/rel/x86_vc10/libtiff[rel_x86_vc10].lib") #pragma comment(lib, "../../../../ImgCore/lib/rel/x86_vc10/giflib[rel_x86_vc10].lib") #pragma comment(lib, "../../../lib/rel/x86_vc10/liblept[rel_x86_vc10].lib") #endif
#include "stdafx.h" #include <iostream> #include <string> using namespace std; static const l_float32 ANGLE1 = 3.14159265 / 12.; void RotateTest() { string strSrc = "../../../testdata/weasel.png"; string strDst = "../../../testdata/dst.gif"; PIX* pixs = pixRead(strSrc.c_str()); if (pixs == NULL) { cout<<" read image error "<<endl; return; } l_int32 w, h, d; pixGetDimensions(pixs, &w, &h, &d); PIX* pixd = pixRotate(pixs, ANGLE1, L_ROTATE_SHEAR, L_BRING_IN_WHITE, w, h); pixWrite(strDst.c_str(), pixd, IFF_GIF); pixDestroy(&pixs); pixDestroy(&pixd); } void EdgeTest() { string strSrc = "../../../testdata/marge.jpg"; string strDst = "../../../testdata/dst.bmp"; PIX* pixs = pixRead(strSrc.c_str()); if (pixs == NULL) { cout<<" read image error "<<endl; return; } l_int32 w, h, d; pixGetDimensions(pixs, &w, &h, &d); if (d != 8) { cout<<"pixs not 8 bpp"<<endl; return; } PIX* pixf = pixSobelEdgeFilter(pixs, L_HORIZONTAL_EDGES); PIX* pixd = pixThresholdToBinary(pixf, 10); pixInvert(pixd, pixd); pixWrite(strDst.c_str(), pixd, IFF_BMP); pixDestroy(&pixs); pixDestroy(&pixf); pixDestroy(&pixd); } int main(int argc, char* argv[]) { RotateTest(); EdgeTest(); cout<<"ok!"<<endl; return 0; }