ORC技术

东西都不是自己的..只贴链接.. 
引用包为: 
tesseract-ocr 
这玩意是开源的.在3.0之后支持中文. 
英文的解析率比较高.至于多少大家可以good查下. 
对中文的解析率,就有点力不从心了.解析率不高. 
但是至少能用.估计可字体颜色大小.图片清晰度神马的都有关系. 
第一篇: 
http://blog.csdn.net/zhoushuyan/article/details/5948289 
这是在java上实现. 
第二篇: 
http://www.cnblogs.com/hangxin1940/archive/2012/01/13/2321507.html 
这是怎么在android下引用/ 
http://blog.csdn.net/libaier_gc/article/details/7420566 
这个是在安卓下的具体使用. 

需要引用包: 
tess-two.tesseract3.01-leptonica1.68-LibJPEG6b.jar 
语言包: 
tessdata 
这个包我下载下来的时候里面只有英文的. 
中文包: 
chi_sim.traineddata这是简体的..繁体的百度and谷歌之. 
中文包真心大. 
50+M 
英文包: 
才18M 
如果是您做的是安卓应用. 
那么你需要先下载好.上述的语言包. 
然后丢到SD卡中. 
baseApi.init(android.os.Environment.getExternalStorageDirectory() 
.getAbsolutePath() + "/ocr", "chi_sim"); 
这个方法便是去SD卡中寻找你的包: 
android.os.Environment.getExternalStorageDirectory().getAbsolutePath() 
获得SD卡的绝对地址. 
/ocr: 就是sd卡下的ocr目录了. 
chi_sim:语言包的名称这个是中文简体.(chi_sim.traineddata) 
init 这个方法的解释: 
     意思就是在sd卡目录下寻找到orc的文件夹.并且在文件中寻找到tessdata文件夹 
tessdata 该文件夹下面存放的则是语音包.

你可能感兴趣的:(ORC技术)