java使用tess4j 小白教程

环境:编译器是IDEA,操作系统Win7

第一步:下载Tess4J 

下载地址:点击打开链接

下载后解压,解压后的目录结构如下

java使用tess4j 小白教程_第1张图片

第二步:引入jar包

将上图目录里dist里面的“tess4j-3.4.8.jar”和lib下的所有jar引入你自己的工程,我是IDEA下的web工程,所以就放在的下图所示的位置

java使用tess4j 小白教程_第2张图片

第三步:指定tessdata文件

tessdata文件是存放的字体库,需要将文件加放到项目根目录(我试过不可以),否则要在代码中指定目录,在代码中这样写

ITesseract instance = new Tesseract();
instance.setDatapath("D:\\Tess4J-3.4.8-src\\Tess4J");//当tessdata的目录是 D:\\Tess4J-3.4.8-src\\Tess4J\\tessdata时
instance.setLanguage("eng");//选择字库文件(只需要文件名,不需要后缀名)

第四步:写测试代码

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import java.io.File;

/**
 * Created by Administrator on 2018-05-25.
 */
public class Demo {
    public static void main(String[] args){

        try {
            File imageFile = new File("E:\\test\\test.png");//图片位置
            ITesseract instance = new Tesseract();
            instance.setDatapath("D:\\Tess4J-3.4.8-src\\Tess4J");
            instance.setLanguage("eng");//选择字库文件(只需要文件名,不需要后缀名)
            String result = instance.doOCR(imageFile);//开始识别
            System.out.println(result);//打印图片内容
        } catch (TesseractException e) {
            e.printStackTrace();
        }
    }
}

注意:

1、上述代码图片位置要换成自己的

2、网上很多说要因dll库的,最新版已经不需要了,tess4j.jar 内有所需dll库

代码下载:点击打开链接

你可能感兴趣的:(工具)