百度找到官网链接:
点击控制台:
登录上去,没有百度账户的可以先注册:
点击产品服务,找到人工智能,然后点击文字识别(下面的图片是老版的智能云):
点击创建应用
随便填自己的想要的名字,应用类型也可以自己选一个:
自己填点内容进去,点击立即创建即可:
创建成功,这两个东西以后要用到的:
分两种方式:
第一是直接url调用api:
官方api链接:http://ai.baidu.com/docs#/OCR-API/top
下面是java实现方式,案例是表格文字识别
import java.io.BufferedReader;
import java.io.DataOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLEncoder;
import java.util.Base64;
import java.util.List;
import java.util.Map;
import org.json.JSONObject;
import com.alibaba.fastjson.JSON;
public class TestApi {
public static void main(String[] args) throws Exception {
/* String ss= "中国";
String s=Base64.getEncoder().encodeToString(ss.getBytes("gbk"));
System.out.println(s);
byte[] b = Base64.getDecoder().decode(s);
System.out.println(new String(b,"gbk"));*/
//第一步,官方要求需要把图片转base64再转URLEncoder
//获取图片base64编码
String image =getImageStr("D:\\360Rec\\183410564149088537.jpg");
String APIKey = "你的APIKey";
String SecretKey = "你的SecretKey";
//第二步, 通过API Key和Secret Key获取的access_token
String access_token = getAuth(APIKey, SecretKey);
System.out.println("access_token: " + access_token);
//拼接请求体
String content = "access_token=" + URLEncoder.encode(access_token, "gbk")
+ "&image=" + URLEncoder.encode(image, "gbk");
//表格识别url
String imageUrl= "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request";
//第三步,发送请求
String response = sendPost(imageUrl, content);
//解析结果拿到request_id再次发送结果接口请求获取识别内容
String result = JSON.parseObject(response).get("result").toString();
String request_id = JSON.parseObject(result.substring(1,result.length()-1)).get("request_id").toString();
System.out.println("request_id: " + request_id);
Thread.sleep(1000*10);//由于解析有延时,所以睡眠一下
//第四步,通过上面获取到的request_id去获取解析结果
//获取结果url
String resultURL= "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/get_request_result";
//拼接结果请求体
String requestData = "access_token=" + URLEncoder.encode(access_token, "gbk")
+ "&request_id=" + URLEncoder.encode(request_id, "gbk")
+ "&result_type=excel";
//发送结果请求
sendPost(resultURL,requestData);
}
/**
* 解析图片转成base64编码
* @param imgFile
* @return
* @throws Exception
*/
public static String getImageStr(String imgFile) throws Exception {
// 将图片文件转化为字节数组字符串,并对其进行Base64编码处理
//String imgFile = "d:\\111.jpg";// 待处理的图片
/* InputStream in = null;
byte[] data = null;
// 读取图片字节数组
try {
in = new FileInputStream(imgFile);
data = new byte[in.available()];
in.read(data);
in.close();
} catch (IOException e) {
e.printStackTrace();
}*/
StringBuffer buffer = new StringBuffer();
BufferedReader bf= new BufferedReader(new FileReader(imgFile));
String s = null;
while((s = bf.readLine())!=null){//使用readLine方法,一次读一行
buffer.append(s.trim());
}
String data = buffer.toString();
// 对字节数组Base64编码
// BASE64Encoder encoder = new BASE64Encoder();
// 返回Base64编码过的字节数组字符串
// return encoder.encode(data.getBytes("gbk"));
return Base64.getEncoder().encodeToString(data.getBytes("gbk"));
}
/**
*
* @param u url地址
* @param param 跟在?后面的参数
* @return
*/
public static String sendPost(String u, String param) {
StringBuffer sbf = new StringBuffer();
try {
URL url = new URL(u);
HttpURLConnection connection = (HttpURLConnection) url.openConnection();
connection.setDoInput(true);
connection.setDoOutput(true);
connection.setRequestMethod("POST");
connection.setUseCaches(false);
connection.setInstanceFollowRedirects(true);
// connection.addRequestProperty("role", "Admin");
connection.addRequestProperty("Content-Type", "application/x-www-form-urlencoded");
// connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
connection.connect();
DataOutputStream out = new DataOutputStream(connection.getOutputStream());
if (!"".equals(param)) {
// 正文,正文内容其实跟get的URL中 '? '后的参数字符串一致
// String content = "字段名=" + URLEncoder.encode("字符串值", "编码");
out.writeBytes(param);
}
out.flush();
out.close();
BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String lines;
while ((lines = reader.readLine()) != null) {
lines = new String(lines.getBytes(), "utf-8");
sbf.append(lines);
}
System.out.println(sbf);
reader.close();
// 断开连接
connection.disconnect();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return sbf.toString();
}
/**
* 通过API Key和Secret Key获取的access_token
* @param ak API Key
* @param sk Secret Key
* @return
*/
public static String getAuth(String ak, String sk) {
// 获取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type为固定参数
+ "grant_type=client_credentials"
// 2. 官网获取的 API Key
+ "&client_id=" + ak
// 3. 官网获取的 Secret Key
+ "&client_secret=" + sk;
try {
URL realUrl = new URL(getAccessTokenUrl);
// 打开和URL之间的连接
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 获取所有响应头字段
Map<String, List<String>> map = connection.getHeaderFields();
// 遍历所有的响应头字段
for (String key : map.keySet()) {
System.err.println(key + "--->" + map.get(key));
}
// 定义 BufferedReader输入流来读取URL的响应
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String result = "";
String line;
while ((line = in.readLine()) != null) {
result += line;
}
/**
* 返回结果示例
*/
System.out.println("result:" + result);
JSONObject jsonObject = new JSONObject(result);
String access_token = jsonObject.getString("access_token");
return access_token;
} catch (Exception e) {
System.err.printf("获取token失败!");
e.printStackTrace(System.err);
}
return null;
}
}
如果有错误可以参考官方的错误信息说明:
链接1:https://cloud.baidu.com/doc/IMAGERECOGNITION/ImageClassify-API/1B.5C.E9.94.99.E8.AF.AF.E7.A0.81.html
链接2:https://cloud.baidu.com/doc/NLP/NLP-Cpp-SDK/36.5C.E9.94.99.E8.AF.AF.E8.BF.94.E5.9B.9E.E6.A0.BC.E5.BC.8F.html
或者上官网社区找:http://ai.baidu.com/forum
第二种sdk方式调用
首先下载jar包,或者maven引入,下面是maven的方式,我用的版本是4.4.1的,下面的${aip.version}可以替换成这个版本号
官网学习链接参考:http://ai.baidu.com/docs#/OCR-Java-SDK/top
官网sdk下载地址:http://ai.baidu.com/sdk
<!--百度云api -->
<dependency>
<groupId>com.baidu.aip</groupId>
<artifactId>java-sdk</artifactId>
<version>${aip.version}</version>
</dependency>
下面是使用案例代码:
import java.util.HashMap;
import org.json.JSONObject;
import com.baidu.aip.ocr.AipOcr;
public class TestAip {
//设置APPID/AK/SK
public static final String APP_ID = "你的APP_ID";
public static final String API_KEY = "你的API_KEY";
public static final String SECRET_KEY = "你的SECRET_KEY";
public static void main(String[] args) {
// 初始化一个AipOcr
AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);
// 可选:设置网络连接参数
client.setConnectionTimeoutInMillis(2000);
client.setSocketTimeoutInMillis(60000);
// 可选:设置代理服务器地址, http和socket二选一,或者均不设置
// client.setHttpProxy("proxy_host", proxy_port); // 设置http代理
// client.setSocketProxy("proxy_host", proxy_port); // 设置socket代理
// 可选:设置log4j日志输出格式,若不设置,则使用默认配置
// 也可以直接通过jvm启动参数设置此环境变量
System.setProperty("aip.log4j.conf", "log4j.properties");
// 传入可选参数调用接口
HashMap<String, String> options = new HashMap<String, String>();
options.put("result_type", "json");
//解析结果拿到request_id再次发送结果接口请求获取识别内容
String result = JSON.parseObject(res.toString(2)).get("result").toString();
String request_id = JSON.parseObject(result.substring(1,result.length()-1)).get("request_id").toString();
System.out.println("request_id: " + request_id);
//String requestId = "11253090_374367";
//睡眠10秒,由于上面请求后,图片解析需要一点时间,这里睡眠一会再去调用结果接口,不然会返回的状态ret_msg是未开始或者进行中
Thread.sleep(1000*10);
// 表格识别结果
JSONObject ress = client.tableResultGet(request_id, options);
System.out.println(ress.toString(2));
}
}
运行结果:
同时可以参考另外两篇相关博文:
百度智能云api的使用(python)、SDK和API的区别是什么?
原文作者:Tlimited
原文链接:https://blog.csdn.net/u014204541/article/details/80944884
我本来是想找图片清晰化的方法,就搜到百度智能云了,不得不感叹云相关的技术发展的真快,真好!