卧槽,javaCV不到十行代码实现图片OCR文字识别

卧槽,javaCV不到十行代码实现图片OCR文字识别_第1张图片

spring boot项目pom文件中添加以下依赖 

		
		
			org.bytedeco
			javacv-platform
			1.5.5
		

 单类代码实现,复制到idea编辑器里,右键run运行即可。

OCR方法参数说明,

1.lng 语言类型 分为两种 1.eng 英语 2.chi_sim 中文简体

2.dataPath 语言数据集文件夹路径

卧槽,javaCV不到十行代码实现图片OCR文字识别_第2张图片

3.imagePath 需要识别的图片文件路径

卧槽,javaCV不到十行代码实现图片OCR文字识别_第3张图片


import org.bytedeco.javacpp.BytePointer;
import org.bytedeco.leptonica.PIX;
import org.bytedeco.leptonica.global.lept;
import org.bytedeco.tesseract.TessBaseAPI;

public class OcrTest {

    public static String OCR(String lng,String dataPath,String imagePath) {
        TessBaseAPI api=new TessBaseAPI();
        if (api.Init(dataPath, lng)!=0){
            System.out.println("error");
        }
        PIX image= lept.pixRead(imagePath);
        if (image==null){
            return "";
        }
        api.SetImage(image);
        BytePointer outText=api.GetUTF8Text();
        String result=outText.getString();
        api.End();
        outText.deallocate();
        lept.pixDestroy(image);
        return result;
    }

    public static void main(String[] args) {
       String text= OCR("chi_sim", "E:\\traineddata", "C:\\Users\\tarzan\\Desktop\\image\\test5.png");
        System.out.println(text);
    }
}

测试样例结果

test1.jpg

卧槽,javaCV不到十行代码实现图片OCR文字识别_第4张图片

test2.jpg

卧槽,javaCV不到十行代码实现图片OCR文字识别_第5张图片

test3.jpg

卧槽,javaCV不到十行代码实现图片OCR文字识别_第6张图片

test4.jpg

卧槽,javaCV不到十行代码实现图片OCR文字识别_第7张图片

test5.jpg

卧槽,javaCV不到十行代码实现图片OCR文字识别_第8张图片

相关文章推荐

JavaCV 将抖音小视频分割成图片帧图片和将图片合成小视频代码实现

需要 traineddata 语言训练数据集的可以关注我,私信获取。

也可以自行付费下载

https://download.csdn.net/download/weixin_40986713/18800645

 

你可能感兴趣的:(粉丝专栏,ocr,java,cv)