android 端拍照并运用Tesseract OCR 识别图片中字符

阅读更多

 

借鉴了一篇博客:
http://my.oschina.net/yushulx/blog/359468#OSC_h3_4

英文版在这里:

http://www.codepool.biz/making-an-android-ocr-application-with-tesseract.html

 

我上传了一个android studio环境下的例子,可以拍照或者选择图库中图片进行识别。


android 端拍照并运用Tesseract OCR 识别图片中字符_第1张图片

 

这个链接(https://github.com/yuzhiyun/TesseractOCR2/)包括一份工程源代码和 两个压缩包(语言包),一个是中文汉字,一个是英文。

请注意:

必须现在手机内部存储根目录

(在程序中获取这个字符串就明白这个目录是什么了Environment.getExternalStorageDirectory())

下新建一个文件夹tessdata,然后把语言包解压后放进这个目录,如果没有语言包,程序会崩溃。

 

程序并不是特别精确,因为是直接识别的,没有对图片进行处理,我会在稍后的博客里讲述如何处理图片(比图锐化等)以提高精确度。

 

 

 

 

 

 

  • android 端拍照并运用Tesseract OCR 识别图片中字符_第2张图片
  • 大小: 253 KB
  • 查看图片附件

你可能感兴趣的:(android,studio,拍照,图库选择图片识别字母数字,Tesseract,OCR)