目录
前言:
代码实现:
首先,我们需要引入百度 AI 开放平台提供的 Java SDK:
记录一下了
com.baidu.aip
baidu-aip-sdk
3.6.0
import com.baidu.aip.ocr.AipOcr;
import org.json.JSONArray;
import org.json.JSONObject;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;
public class ImageRecognition {
// 设置 APPID/AK/SK
public static final String APP_ID = "your_app_id";
public static final String API_KEY = "your_api_key";
public static final String SECRET_KEY = "your_secret_key";
public static void main(String[] args) {
byte[] imageData = getImageData("test.png"); // 读取测试图片数据
String result = recognizeText(imageData); // 识别图片中的文字
System.out.println(result);
}
/**
* 读取图片数据
*/
private static byte[] getImageData(String imagePath) {
try (InputStream inputStream = ImageRecognition.class.getClassLoader().getResourceAsStream(imagePath);
ByteArrayOutputStream outputStream = new ByteArrayOutputStream()) {
byte[] buffer = new byte[1024];
int len;
while ((len = inputStream.read(buffer)) != -1) {
outputStream.write(buffer, 0, len);
}
return outputStream.toByteArray();
} catch (IOException e) {
e.printStackTrace();
return null;
}
}
/**
* 识别图片中的文字
*/
private static String recognizeText(byte[] imageData) {
// 初始化一个 AipOcr 客户端
AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);
// 设置请求参数
HashMap options = new HashMap<>();
options.put("language_type", "CHN_ENG"); // 中英文混合
options.put("detect_direction", "true"); // 检测朝向
options.put("detect_language", "true"); // 是否检测语言
options.put("probability", "true"); // 是否返回识别结果中每一行的置信度
// 发送 OCR 识别请求
JSONObject result = client.basicGeneral(imageData, options);
System.out.println(result.toString());
// 解析 OCR 识别结果
StringBuilder stringBuilder = new StringBuilder();
JSONArray jsonArray = result.getJSONArray("words_result");
for (int i = 0; i < jsonArray.length(); i++) {
JSONObject jsonObject = jsonArray.getJSONObject(i);
String text = jsonObject.getString("words");
stringBuilder.append(text).append("\n");
}
return stringBuilder.toString();
}
}
getImageData()
方法来读取测试图片的数据,然后通过 recognizeText()
方法来识别图片中的文字。在 recognizeText()
方法中,我们首先初始化了一个 AipOcr
客户端,然后设置了请求参数,最后发送 OCR 识别请求并解析识别结果。