java实现OCR图文识别Tess4j,高准确率高效率

java实现OCR图文识别Tess4j,高准确率高效率,用最新的词库2秒就可以识别,没有最新词库的找我

傻瓜式调用中文词库,及其方便。

虽然不能达到99%的准确率,但是也能达到90%左右的准确率,而且效率也非常高。总体来说相对于各大厂商的API接口来说,高昂的费用省下来不香吗。

本文以一张简单的图片为例:图片放置在E:/App/TestTess4/src/main/resources/bbb.png,因此使用代码测试前需要修改代码中指定的两个路径!!!

这篇文章是我从网络上随便找的,文字还是很优美哦

java实现OCR图文识别Tess4j,高准确率高效率_第1张图片

  /**
     * 图片文字识别
     */
    public void ocrDemo(){
        File imageFile = new File("E:/App/TestTess4/src/main/resources/bbb.png");
        Tesseract instance = new Tesseract();
        instance.setDatapath(DATA_PATH);
        instance.setVariable("user_defined_dpi", "300");
        instance.setLanguage(DEFAULT_LANG);

        try {
            long startTime = System.currentTimeMillis();
            String result = instance.doOCR(imageFile);
            System.out.println(result);

            long endTime = System.currentTimeMillis();
            long seconds = (endTime - startTime) / 1000;
            System.out.println("共用时:"+ seconds + "秒");
        } catch(TesseractException e){
            e.printStackTrace();
        }
    }

一个简单的验证码识别就算完成了,怎么样是不是很简单。

你可能感兴趣的:(maven,图像处理,人工智能)