Tesseract in Java - Intellij IDEA对Tess4J的配置和使用

最近要弄OCR,按照官方的一步步来,外网慢的很,一些要下的我已经传到csdn给大家下载。

官网:http://tess4j.sourceforge.net/codesample.html

中文训练库下载地址:
http://download.csdn.net/detail/d_dmelon/9916532
其他语言库:
https://github.com/tesseract-ocr/tessdata

Tess4J3.4下载地址:
http://download.csdn.net/detail/d_dmelon/9916519

安装Visual C++ 2015 Redistributable Packages(官网:The Windows native libraries were built with VS2015 and therefore depend on the Visual C++ 2015 Redistributable Packages.)
http://download.csdn.net/detail/d_dmelon/9916663

环境: JDK1.8 Intellij IDEA
解压Tess4J 3.4.zip文件,拷贝dist目录下的jar文件到IDEA的工程目录(我是新建了一个libs文件夹),拷贝tessdata文件夹到项目工程下(与src文件夹同级),在把中文训练库chi_sim拷贝到这个tessdata文件夹里。

(如果不行的话,使用IDEA-Project Structure-Libraries-绿色加号add,把解压目录的lib路径添加进去编译,我反正根据上述步骤就行了)
demo

package net.sourceforge.tess4j.example;

import java.io.File;
import net.sourceforge.tess4j.*;

public class TesseractExample {

    public static void main(String[] args) {
        File imageFile = new File("<图片地址>");
        ITesseract instance = new Tesseract();  
        instance.setLanguage("chi_sim");
        try {
            String result = instance.doOCR(imageFile);
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        }
    }
}

你可能感兴趣的:(Java)