android-ocr 光学字符识别技术

支持原创,转载请注明出处: http://blog.csdn.net/wuzhiqun27/article/details/8647224

 

因为工作需要,这两天一直在找实现OCR的android源码。。。各种碰壁各种纠结,各种红字各种报错!! 郁闷到爆。。。。

 

好吧,抱怨完毕,说说我的实现。

 

使用的是开源引擎 tesseract ,没有linux环境,直接在某个源码里面挖到编译好的动态库(libs中)。

下的源码太多,已经不记得是哪个网站上下的了,再次感谢各位前辈的共享,也因此觉得应该把自己的共享出来。

 

先贴一下代码结构:

 

 

 

 

 

 

 

 

 

 

 其中前面两个包,com.googlecode.leptonica.android 和 com.googlecode.tesseract.android 是从官网下的tess-two的源码(官网网址https://github.com/rmtheis/tess-two),下载的压缩包中有三个文件夹,我们需要的源码在tess-two文件夹下 。

之前有用过网上下的tess-two的jar包(tess-two.tesseract3.01-leptonica1.68-LibJPEG6b.jar),里面的代码版本不够,运行时会报错,果断去官网,直接下源码,于是乎,就找到了上面的tess-two源码,直接放到工程里,OK,运行正常!!

 

当前识别的图片路径为/mnt/sdcard/test5.jpg。 当前语言包的存放路径为/mnt/sdcard/tesseract/tessdata/。引擎为第三版本,可识别第三版本的语言包,支持中文识别。语言包需自行下载,中文包(chi_sim.traineddata.gz),英文包(eng.traineddata.gz),解压后放入上述文件夹。目前使用的是中文语言包,要更改语言包请到代码中自行更改。

 

最后附上源码下载地址: http://download.csdn.net/detail/wuzhiqun27/5120148

 

中文简体语言包下载地址: http://download.csdn.net/detail/wuzhiqun27/5120324

 

英文语言包下载地址: http://download.csdn.net/detail/wuzhiqun27/5120547

 

更多语言包下载地址: http://code.google.com/p/tesseract-ocr/downloads/list

你可能感兴趣的:(ocr光学字符识别技术)