关于图片识别文字OCR踩坑

最近,PM让我去研究一下图片识别文字,我试了好多开源Soft。Tess4J,Tesseract-OCR,还有百度OCR。

直到我用了百度OCR,我只能告诉各位,真香。是真的香,谁用谁知道。这里我就给各位直接说下入门怎么去实现,他需要走百度去获取Access Token。简单粗暴的步骤如下。

先去写一个demo类。创建一个获取Token的类。类的代码如下

package com.baidu.ai.aip.auth;

import org.json.JSONObject;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;

/**
 * 获取token类
 */

public class AuthService {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "cokAd9fLCTptAbIidbLIN5a8";//百度的AK
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z";//百度的SK
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }

}

然后你再写一个main方法如下

package com.baidu.ai.aip.auth;

public class Main {
    public static void main(String[] args) {
        AuthService authService = new AuthService();
        String auth = AuthService.getAuth("cokAd9fLCTptAbIidbLIN5a8","D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z");
        System.out.println(auth);
    }
}

这里参数一个是你自己注册的AK码还有SK码。

启动后会打印你的token令牌。然后去postman里写一个POST请求的接口,https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=24.a67772908b7efb7c5feb0be718619f09.2592000.1597404417.282335-21374888

token替换你自己的token,然后在Headers里面写一个key:Content-Type  Value:application/x-www-form-urlencoded

再在Body里指定x-www-form-urlencoded 格式,然后指定key:image   Value:为你要识别的图片(图片需要转Base64码,百度一大堆搜一下,然后去掉“data:image/*;base64,”)然后调接口,就能得到图片里的文字了。然后时间一般保持在几十毫秒。只能说真香!

你可能感兴趣的:(ocr,java)