[百度API识别图片 ]

目录

 前言:

 代码实现:

 首先,我们需要引入百度 AI 开放平台提供的 Java SDK:


 前言:

   记录一下了

 代码实现:

  •  下面给出一个 Java 图片识别的详细 demo,这里以百度 AI 开放平台提供的 OCR 文字识别 API 为例。
  • 首先,我们需要在百度 AI 开放平台上创建一个应用,获取 AppID、API Key 和 Secret Key。然后,我们可以使用百度提供的 Java SDK 来实现 OCR 文字识别的功能。这里需要注意的是,百度 AI 开放平台提供了两个版本的 Java SDK,一个是基于 Apache HttpClient 的版本,另一个是基于 OkHttp 的版本。这里我们使用基于 OkHttp 的版本来实现 OCR 文字识别的功能。

 首先,我们需要引入百度 AI 开放平台提供的 Java SDK:


    com.baidu.aip
    baidu-aip-sdk
    3.6.0

import com.baidu.aip.ocr.AipOcr;
import org.json.JSONArray;
import org.json.JSONObject;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;

public class ImageRecognition {

    // 设置 APPID/AK/SK
    public static final String APP_ID = "your_app_id";
    public static final String API_KEY = "your_api_key";
    public static final String SECRET_KEY = "your_secret_key";

    public static void main(String[] args) {
        byte[] imageData = getImageData("test.png"); // 读取测试图片数据
        String result = recognizeText(imageData); // 识别图片中的文字
        System.out.println(result);
    }

    /**
     * 读取图片数据
     */
    private static byte[] getImageData(String imagePath) {
        try (InputStream inputStream = ImageRecognition.class.getClassLoader().getResourceAsStream(imagePath);
             ByteArrayOutputStream outputStream = new ByteArrayOutputStream()) {
            byte[] buffer = new byte[1024];
            int len;
            while ((len = inputStream.read(buffer)) != -1) {
                outputStream.write(buffer, 0, len);
            }
            return outputStream.toByteArray();
        } catch (IOException e) {
            e.printStackTrace();
            return null;
        }
    }

    /**
     * 识别图片中的文字
     */
    private static String recognizeText(byte[] imageData) {
        // 初始化一个 AipOcr 客户端
        AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);

        // 设置请求参数
        HashMap options = new HashMap<>();
        options.put("language_type", "CHN_ENG"); // 中英文混合
        options.put("detect_direction", "true"); // 检测朝向
        options.put("detect_language", "true"); // 是否检测语言
        options.put("probability", "true"); // 是否返回识别结果中每一行的置信度

        // 发送 OCR 识别请求
        JSONObject result = client.basicGeneral(imageData, options);
        System.out.println(result.toString());

        // 解析 OCR 识别结果
        StringBuilder stringBuilder = new StringBuilder();
        JSONArray jsonArray = result.getJSONArray("words_result");
        for (int i = 0; i < jsonArray.length(); i++) {
            JSONObject jsonObject = jsonArray.getJSONObject(i);
            String text = jsonObject.getString("words");
            stringBuilder.append(text).append("\n");
        }
        return stringBuilder.toString();
    }
}
  • 实现中,我们通过 getImageData() 方法来读取测试图片的数据,然后通过 recognizeText() 方法来识别图片中的文字。在 recognizeText() 方法中,我们首先初始化了一个 AipOcr 客户端,然后设置了请求参数,最后发送 OCR 识别请求并解析识别结果。
  • 在这个实现中,我们使用了默认的 OCR 识别模式,即通用文字识别模式,适用于识别一般场景下的文字。如果需要识别特定场景下的文字,如银行卡、车牌等,可以使用不同的 OCR 识别模式。同时,我们也可以根据需要自定义 OCR 识别参数,详细的参数说明可以参考百度 AI 开放平台的文档。

你可能感兴趣的:(百度)